DIVE：用 DINO 做主体驱动视频编辑

一句话结论

这篇工作把 subject-driven editing 正式推入视频侧，补强了个体主体保持与视频编辑结合的路线。

问题定义

它要解决的是视频编辑中如何围绕特定主体进行稳定修改的问题。对当前知识库来说，它把 DreamBooth/主体驱动图像生成那条线继续往视频编辑方向延伸。

方法概述

DIVE 通过引入 DINO 等表征来支撑 subject-driven video editing，强调在视频编辑过程中保持主体身份与相关特征的一致性。

关键发现

它说明主体驱动路线已经不再只停留在图像生成，而是在向视频编辑扩张。
它把 image-generation 中的个性化/主体保持问题，重新带进了 video-editing。
它为未来比较“统一主体驱动生成编辑系统”提供了很好的跨模态样本。

局限或疑问

主体驱动视频编辑通常更容易受到时序一致性和身份漂移挑战。
它更聚焦 subject-driven 场景，不等于覆盖一般视频编辑。
它是扩展路线的重要节点，但还不够构成完整统一框架。

原始链接

https://arxiv.org/abs/2412.03347
https://arxiv.org/pdf/2412.03347

备注

DIVE 在这套库里的作用，是把主体驱动生成/编辑主线进一步延伸到视频侧。

元数据

{ "id": "2026-04-14-dive-subject-driven-video-editing", "type": "source", "title": "DIVE（ICCV 2025）：用 DINO 做主体驱动视频编辑", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "ICCV 2025", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "video-editing", "image-editing", "image-generation", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Huang, Yi", "Xiong, Wei", "Zhang, He", "Chen, Chaoqi", "Liu, Jianzhuang", "Yan, Mingfu", "Chen, Shifeng" ], "published_at": "2024/12/04", "canonical_links": [ "https://arxiv.org/abs/2412.03347", "https://arxiv.org/pdf/2412.03347" ], "raw_entry": "raw/ingest/2026-04-14-dive-subject-driven-video-editing/", "topics": [ "topics/video-editing", "topics/image-editing", "topics/image-generation" ], "entities": [ "entities/video-editing-understanding" ], "claims": [], "questions": [ "questions/question-do-benchmarks-track-real-video-editing-understanding", "questions/question-will-unified-image-models-sustain-their-advantage" ] }

DIVE用 DINO 做主体驱动视频编辑