LVBench：极限长视频理解基准

一句话结论

这篇工作把极限长视频理解 benchmark 补进库里，显著加强了 video-understanding 对长上下文问题的覆盖。

问题定义

它要解决的是现有视频理解 benchmark 往往不够长，无法真正暴露模型在长时间跨度上丢失关键信息的问题。对当前知识库来说，它正好填补了 video-understanding 页一直保留的“长上下文”缺口。

方法概述

LVBench 构建面向极限长视频理解的 benchmark，用来测试模型在长时序、多事件视频上的保持能力、推理能力与细节追踪能力。

关键发现

它让 video-understanding 页不再只依赖综合 benchmark 和 failure diagnosis，而真正有了 long-context benchmark。
它能帮助后续判断哪些模型只是短视频表现好，而不是具备真实长时序理解能力。
它对未来开题也很有价值，因为长视频理解本身就是很自然的改进切口。

局限或疑问

它主要衡量长视频理解，不直接等于视频编辑理解。
长上下文 benchmark 依然可能受题目构造方式影响。
它强化了时序范围维度，但不独自覆盖全部理解能力。

原始链接

https://arxiv.org/abs/2406.08035
https://arxiv.org/pdf/2406.08035

备注

LVBench 在这套库里的作用，是把长视频理解 benchmark 这条线正式补入 video-understanding 主干。

元数据

{ "id": "2026-04-14-lvbench", "type": "source", "title": "LVBench（ICCV 2025）：极限长视频理解基准", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "ICCV 2025", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "video-understanding", "evaluation", "benchmarking", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Wang, Weihan", "He, Zehai", "Hong, Wenyi", "Cheng, Yean", "Zhang, Xiaohan", "Qi, Ji", "Gu, Xiaotao", "Huang, Shiyu", "Xu, Bin", "Dong, Yuxiao", "Ding, Ming", "Tang, Jie" ], "published_at": "2024/06/12", "canonical_links": [ "https://arxiv.org/abs/2406.08035", "https://arxiv.org/pdf/2406.08035" ], "raw_entry": "raw/ingest/2026-04-14-lvbench/", "topics": [ "topics/video-understanding", "topics/generative-model-evaluation" ], "entities": [], "claims": [], "questions": [ "questions/question-do-benchmarks-track-real-video-editing-understanding" ] }

LVBench极限长视频理解基准