ArticleMetadataMain page

source · 2026-04-17

FiVE-Bench(ICCV 2025):细粒度视频编辑评测基准

FiVE-Bench(ICCV 2025):细粒度视频编辑评测基准

会议:ICCV 2025
发表日期:2025-01-01
资料加入日期:2026-04-14
深分析稿:raw/ingest/2026-04-14-five-bench/analysis

一句话结论

FiVE-Bench 把视频编辑 benchmark 进一步细粒度化,说明 video-editing 的评测已经从“好不好”推进到“到底哪一类编辑能力强、哪一类弱”的剖面化阶段。

论文定位

这篇论文是“fine-grained video editing benchmark”路线里的代表作。它的主要贡献不在于生成模型,而在于把评测精度推进到更细的能力拆解层。

问题定义

作者针对的是现有视频编辑评测过粗的问题:

  • 很难区分不同编辑能力的真实差异
  • 很难分析新一代 diffusion / RF 模型在哪一类编辑任务上失效
  • 只给整体印象,不足以形成能力画像

方法概述

FiVE-Bench 有三层关键设计:

  1. benchmark 任务组织
  2. 用 source video、source prompt、target prompt 定义视频编辑任务。

  1. 六类细粒度编辑任务
  2. 包括对象替换、非刚体形变、颜色编辑、材质编辑、对象添加和对象移除等。

  1. FiVE-Acc 评测指标
  2. 通过 VLM 问答式评估判断编辑是否成功完成,以补足粗糙指标的不足。

关键发现

  • 视频编辑模型在不同细粒度任务上的能力差异很大。
  • benchmark 更细后,模型优劣会呈现更明确的能力剖面,而不只是一个总印象。
  • FiVE-Acc 使 benchmark 具备更强自动化评估能力。
  • 这篇论文把 video-editing 评测推进到了更接近“能力画像”而不是“总分排名”的阶段。

关键图示

FiVE-Bench 总览图

!900

这一页展示 benchmark 的整体设计、数据组织、编辑任务示例以及 FiVE-Acc 的角色,是 source note 最适合的首图。

FiVE-Acc 评测流程

!900

这一页解释 benchmark 如何定义任务,以及 FiVE-Acc 如何通过 VLM 的结构化问答来判断视频编辑是否真正成功。

六类编辑任务案例对比

!900

这一页集中展示六类细粒度编辑任务及多模型 qualitative comparison,是说明 benchmark 覆盖能力维度与案例分析的关键结果页。

核心实验与结果

  • FiVE-Bench 让不同视频编辑模型在更细粒度任务上的差异变得清晰可见。
  • 案例页说明对象替换、材质编辑、对象添加/移除等任务难度差异明显。
  • 这篇 benchmark 使 video-editing 的评测不再只依赖宽泛 benchmark 或人工直觉。
  • 它非常适合与 Video-Bench、AIGV-Assessor 和 Neuro-Symbolic Evaluation 一起构成更完整的评测矩阵。

局限或疑问

  • benchmark 更细并不自动等于更贴近真实用户价值。
  • 它补的是测量精度,而不直接提升模型能力。
  • 仍需要和其他评测路线配套阅读,才能理解“好 benchmark”到底该测什么。

对当前 wiki 判断的影响

  • 它显著补强了 topics/generative-model-evaluation 中“video-editing 已经开始拥有自己的细粒度 benchmark”这条判断。
  • topics/video-editing 来说,它让我们能更具体讨论模型到底是哪种编辑能力弱。
  • questions/question-do-benchmarks-track-real-video-editing-understanding 来说,它提供了“评测粒度细化”这一条重要证据线。

相关页面

原始链接

  • https://openaccess.thecvf.com/content/ICCV2025/html/Li_FiVE-Bench_A_Fine-grained_Video_Editing_Benchmark_for_Evaluating_Emerging_Diffusion_ICCV_2025_paper.html
  • https://openaccess.thecvf.com/content/ICCV2025/papers/Li_FiVE-Bench_A_Fine-grained_Video_Editing_Benchmark_for_Evaluating_Emerging_Diffusion_ICCV_2025_paper.pdf