ArticleMetadataMain page

source · 2026-04-15

LVBench(ICCV 2025):极限长视频理解基准

LVBench(ICCV 2025):极限长视频理解基准

会议:ICCV 2025
发表日期:2024/06/12
资料加入日期:2026-04-14

一句话结论

这篇工作把极限长视频理解 benchmark 补进库里,显著加强了 video-understanding 对长上下文问题的覆盖。

问题定义

它要解决的是现有视频理解 benchmark 往往不够长,无法真正暴露模型在长时间跨度上丢失关键信息的问题。对当前知识库来说,它正好填补了 video-understanding 页一直保留的“长上下文”缺口。

方法概述

LVBench 构建面向极限长视频理解的 benchmark,用来测试模型在长时序、多事件视频上的保持能力、推理能力与细节追踪能力。

关键发现

  • 它让 video-understanding 页不再只依赖综合 benchmark 和 failure diagnosis,而真正有了 long-context benchmark。
  • 它能帮助后续判断哪些模型只是短视频表现好,而不是具备真实长时序理解能力。
  • 它对未来开题也很有价值,因为长视频理解本身就是很自然的改进切口。

局限或疑问

  • 它主要衡量长视频理解,不直接等于视频编辑理解。
  • 长上下文 benchmark 依然可能受题目构造方式影响。
  • 它强化了时序范围维度,但不独自覆盖全部理解能力。

原始链接

  • https://arxiv.org/abs/2406.08035
  • https://arxiv.org/pdf/2406.08035

相关页面

备注

LVBench 在这套库里的作用,是把长视频理解 benchmark 这条线正式补入 video-understanding 主干。