AnyEdit：面向任意创意的统一高质量图像编辑

一句话结论

AnyEdit 证明了统一图像编辑系统的核心瓶颈很大程度上在高质量多任务数据和任务组织方式；当 20+ 编辑类型、250 万+ 编辑对、任务感知路由和任务嵌入被放进同一系统后，统一编辑器的稳定性会明显提升。

论文定位

这篇论文更像“统一编辑系统工程样本”，它的主贡献来自一条可扩展的数据构建与筛选流水线，以及让统一扩散编辑器更适配多任务训练的任务感知机制。

问题定义

论文聚焦 instruction-based image editing 的三个痛点：

复杂指令执行不稳定
编辑类型覆盖太窄
训练数据噪声高、质量不一致

作者的判断很直接：如果训练数据和任务组织方式不够强，统一编辑器很难兑现“任意创意编辑”的承诺。

方法概述

AnyEdit 包含两层关键设计：

AnyEdit 数据集

构建 250 万+ 高质量编辑图像对，覆盖 20 多种编辑类型和 5 个领域，通过通用数据准备、指令生成、自适应编辑流水线和自动筛选共同保证质量与多样性。

AnyEdit Stable Diffusion（AnySD）

在统一扩散编辑器里加入 task-aware routing 和 learnable task embedding，让多种编辑任务共享模型时拥有更稳定的任务条件和更清晰的路由边界。

关键发现

统一编辑器的效果上限高度依赖高质量编辑数据。
多任务统一训练需要显式任务路由，单纯堆任务会放大互相干扰。
论文把 instruction following、source image detail preservation 和任务覆盖面一起当作一级目标。
AnyEdit 的贡献点首先在“系统化数据生产 + 统一编辑组织”，其次才是模型层局部模块设计。

关键图示

方法与数据构建总览

!900

Figure 2 展示了 AnyEdit 的完整构建流程：通用数据准备、指令生成、自适应编辑流水线、图像质量评估和数据集收集。这张图最能解释论文为什么把数据构建当成核心贡献。

多任务复杂编辑结果

!900

这一页集中展示复杂编辑任务上的定性结果，覆盖动作修改、属性变化、目标增删、背景替换、风格迁移、几何变换和补全，直观体现了 AnyEdit 的任务覆盖面。

visual editing 对比与消融

!900

这一页同时给出 visual editing 对比和 task-aware routing / task map 等模块消融，说明统一系统中的任务结构设计对性能确实有贡献。

核心实验与结果

根据论文摘要、页面预览和现有证据，可以稳定得出四点：

AnyEdit 在多个 benchmark 上持续提升扩散式编辑模型性能。
复杂多任务 instruction editing 的收益来自更高质量、更广覆盖的数据。
visual editing 场景下，任务结构设计和任务映射依旧重要。
这篇论文的实验叙事强调“复杂度与覆盖面”，很适合当作统一编辑器工程路线的代表样本。

局限或疑问

数据构造链条越强，模型性能越依赖数据流水线质量。
统一系统覆盖广，单项编辑类别是否都达到最强仍需更细致对照。
失败模式可能被总体指标掩盖，后续值得继续追踪细分类别表现。

对当前 wiki 判断的影响

它显著补强了 topics/image-editing 中“数据质量仍是性能瓶颈”的判断。
它也为 entities/unified-image-generation-editing 提供了一条系统工程层的支持证据：统一路线能成立，靠的是训练组织与任务组织一起升级。
它使 claims/claim-unified-models-may-outcompete-specialized-image-pipelines 更有说服力，因为 AnyEdit 展示了统一系统在工程扩展性上的潜力。

原始链接

https://openaccess.thecvf.com/content/CVPR2025/html/Yu_AnyEdit_Mastering_Unified_High-Quality_Image_Editing_for_Any_Idea_CVPR_2025_paper.html
https://openaccess.thecvf.com/content/CVPR2025/papers/Yu_AnyEdit_Mastering_Unified_High-Quality_Image_Editing_for_Any_Idea_CVPR_2025_paper.pdf

AnyEdit面向任意创意的统一高质量图像编辑

一句话结论

论文定位

问题定义

方法概述

关键发现

关键图示

方法与数据构建总览

多任务复杂编辑结果

visual editing 对比与消融

核心实验与结果

局限或疑问

对当前 wiki 判断的影响

相关页面

原始链接

元数据