ArticleMetadataMain page

source · 2026-04-15

StableVideo(ICCV 2023):文本驱动且一致性感知的扩散视频编辑

StableVideo(ICCV 2023):文本驱动且一致性感知的扩散视频编辑

会议:ICCV 2023
发表日期:2023/08/18
资料加入日期:2026-04-14

一句话结论

这篇工作把 consistency-aware 扩散明确推成文本驱动视频编辑的核心诉求,补强了时序一致性路线。

问题定义

它要解决的是文本驱动视频编辑常常会破坏跨帧一致性的问题。对当前知识库来说,它补的是 video-editing 主线里“编辑正确”之外的一条长期主矛盾。

方法概述

StableVideo 通过 consistency-aware diffusion 机制来做 text-driven video editing,强调在执行编辑指令的同时更好保持时序一致性。

关键发现

  • 它说明视频编辑里“一致性”并不是附加优化,而是核心竞争维度。
  • 它和 RAVE、CAMEL、MotionEditor 一起,让视频编辑的时序质量主线更完整。
  • 它也帮助我们区分“运动质量”和“跨帧一致性”这两个相关但不同的目标。

局限或疑问

  • 一致性感知方法未必自动提升更复杂编辑的可控性。
  • 它更偏扩散式时序稳定化,不代表其他架构路线。
  • 它强化了质量目标,但仍需要细粒度 benchmark 来验证。

原始链接

  • https://arxiv.org/abs/2308.09592
  • https://arxiv.org/pdf/2308.09592

相关页面

备注

StableVideo 在这套库里的作用,是把 consistency-aware 视频编辑路线补成明确节点。