ArticleMetadataMain page

source · 2026-04-15

DIVE(ICCV 2025):用 DINO 做主体驱动视频编辑

DIVE(ICCV 2025):用 DINO 做主体驱动视频编辑

会议:ICCV 2025
发表日期:2024/12/04
资料加入日期:2026-04-14

一句话结论

这篇工作把 subject-driven editing 正式推入视频侧,补强了个体主体保持与视频编辑结合的路线。

问题定义

它要解决的是视频编辑中如何围绕特定主体进行稳定修改的问题。对当前知识库来说,它把 DreamBooth/主体驱动图像生成那条线继续往视频编辑方向延伸。

方法概述

DIVE 通过引入 DINO 等表征来支撑 subject-driven video editing,强调在视频编辑过程中保持主体身份与相关特征的一致性。

关键发现

  • 它说明主体驱动路线已经不再只停留在图像生成,而是在向视频编辑扩张。
  • 它把 image-generation 中的个性化/主体保持问题,重新带进了 video-editing。
  • 它为未来比较“统一主体驱动生成编辑系统”提供了很好的跨模态样本。

局限或疑问

  • 主体驱动视频编辑通常更容易受到时序一致性和身份漂移挑战。
  • 它更聚焦 subject-driven 场景,不等于覆盖一般视频编辑。
  • 它是扩展路线的重要节点,但还不够构成完整统一框架。

原始链接

  • https://arxiv.org/abs/2412.03347
  • https://arxiv.org/pdf/2412.03347

相关页面

备注

DIVE 在这套库里的作用,是把主体驱动生成/编辑主线进一步延伸到视频侧。