StableVideo：文本驱动且一致性感知的扩散视频编辑

一句话结论

这篇工作把 consistency-aware 扩散明确推成文本驱动视频编辑的核心诉求，补强了时序一致性路线。

问题定义

它要解决的是文本驱动视频编辑常常会破坏跨帧一致性的问题。对当前知识库来说，它补的是 video-editing 主线里“编辑正确”之外的一条长期主矛盾。

方法概述

StableVideo 通过 consistency-aware diffusion 机制来做 text-driven video editing，强调在执行编辑指令的同时更好保持时序一致性。

关键发现

它说明视频编辑里“一致性”并不是附加优化，而是核心竞争维度。
它和 RAVE、CAMEL、MotionEditor 一起，让视频编辑的时序质量主线更完整。
它也帮助我们区分“运动质量”和“跨帧一致性”这两个相关但不同的目标。

局限或疑问

一致性感知方法未必自动提升更复杂编辑的可控性。
它更偏扩散式时序稳定化，不代表其他架构路线。
它强化了质量目标，但仍需要细粒度 benchmark 来验证。

原始链接

https://arxiv.org/abs/2308.09592
https://arxiv.org/pdf/2308.09592

备注

StableVideo 在这套库里的作用，是把 consistency-aware 视频编辑路线补成明确节点。

元数据

{ "id": "2026-04-14-stablevideo", "type": "source", "title": "StableVideo（ICCV 2023）：文本驱动且一致性感知的扩散视频编辑", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "ICCV 2023", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "video-editing", "video-generation", "diffusion", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Chai, Wenhao", "Guo, Xun", "Wang, Gaoang", "Lu, Yan" ], "published_at": "2023/08/18", "canonical_links": [ "https://arxiv.org/abs/2308.09592", "https://arxiv.org/pdf/2308.09592" ], "raw_entry": "raw/ingest/2026-04-14-stablevideo/", "topics": [ "topics/video-editing", "topics/video-generation" ], "entities": [ "entities/video-editing-understanding" ], "claims": [], "questions": [ "questions/question-do-benchmarks-track-real-video-editing-understanding" ] }

StableVideo文本驱动且一致性感知的扩散视频编辑