VEU-Bench：迈向对视频编辑的全面理解

一句话结论

这篇工作认为，视频编辑理解本身是一个长期被低估的 benchmark 缺口，而且许多现有 Vid-LLM 在这个问题上比人们想象得更弱。

问题定义

它要解决的是视频编辑研究里“会不会理解编辑”缺乏系统评测的问题。没有专门 benchmark，模型即使生成看起来不错，也不代表真的理解了编辑任务。

方法概述

方法上，VEU-Bench 构建了覆盖识别、推理和判断三大类、19 个细粒度任务的 benchmark，并配合 ontology 支撑的标注流程，还在其上微调了专家模型。

关键发现

视频编辑理解是一个过去明显被低估且确实很难的问题。
许多当前 Vid-LLM 在这个方向上表现偏弱。
针对编辑理解的专门监督还有助于更广泛的视频推理能力。

局限或疑问

这是评测与理解工作，而不是直接做编辑生成。
benchmark 的定义方式会很强地影响结论。
还需要把理解指标和真实编辑质量建立更明确联系。

原始链接

https://openaccess.thecvf.com/content/CVPR2025/html/Li_VEU-Bench_Towards_Comprehensive_Understanding_of_Video_Editing_CVPR_2025_paper.html
https://openaccess.thecvf.com/content/CVPR2025/papers/Li_VEU-Bench_Towards_Comprehensive_Understanding_of_Video_Editing_CVPR_2025_paper.pdf

备注

VEU-Bench 在当前知识库里非常关键，因为它让“视频编辑理解”从模糊感觉变成了可以被单独追踪的研究对象。也正因为如此，它直接支撑了我们现在已有的相关 entity 和 claim。

元数据

{ "id": "2026-04-12-veu-bench", "type": "source", "title": "VEU-Bench（CVPR 2025）：迈向对视频编辑的全面理解", "status": "reviewed", "created": "2026-04-12", "updated": "2026-04-15", "venue": "CVPR 2025", "ingested_at": "2026-04-12", "tags": [ "near-cvpr-2025", "video-editing", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Bozheng Li", "Yongliang Wu", "Yi Lu", "Jiashuo Yu", "Licheng Tang", "Jiawang Cao", "Wenqing Zhu", "Yuyang Sun", "Jay Wu", "Wenbo Zhu" ], "published_at": "2025-06-11", "canonical_links": [ "https://openaccess.thecvf.com/content/CVPR2025/html/Li_VEU-Bench_Towards_Comprehensive_Understanding_of_Video_Editing_CVPR_2025_paper.html", "https://openaccess.thecvf.com/content/CVPR2025/papers/Li_VEU-Bench_Towards_Comprehensive_Understanding_of_Video_Editing_CVPR_2025_paper.pdf" ], "raw_entry": "raw/ingest/2026-04-12-veu-bench/", "topics": [ "topics/video-editing", "topics/video-generation", "topics/generative-model-evaluation" ], "entities": [], "claims": [], "questions": [] }

VEU-Bench迈向对视频编辑的全面理解