图像生成与编辑统一建模

概述

这一页对应“图像生成与图像编辑统一建模”这一方法家族。它反映的核心趋势是：未来的图像系统不再把生成和编辑拆成完全不同的流水线，而是越来越倾向于用共享模型、共享训练框架或共享接口来覆盖多种任务。对当前 vault 来说，这是图像侧最强的跨论文主线之一，因为它同时改变了模型设计、训练组织和产品交互方式。

这个实体为什么重要

它把原本割裂的图像生成、图像编辑、条件控制等任务收束到同一个系统视角下。
它不只是“多做几个任务”，而是在推动图像模型从单点能力走向通用视觉变换器。
它直接决定后续很多论文应被看作统一谱系中的不同分支，而不是拆成互不相干的桶。

当前观察到的主要分支

统一接口派

sources/2026-04-12-omnigen 代表“统一接口 + 工作流简化”路线，把多任务收进更接近 LLM 的单一图像系统入口。

联合训练派

sources/2026-04-12-dreamomni 代表“联合训练 + synthetic data pipeline”路线，强调生成与编辑共享训练、共享扩展能力。

数据工厂派

sources/2026-04-12-anyedit 补入了“统一编辑系统工程”这一支，说明统一路线也可以首先建立在高质量编辑数据和任务组织上。

世界动态派 / 跨任务借模派

sources/2026-04-12-unireal 把统一建模推进到非连续视频生成与 world dynamics 学习层面。
sources/2026-04-14-pathways-image-manifold 更进一步说明，编辑任务本身可以被重写到视频生成路径里，统一不再只是接口统一，而是任务形式统一。

这条实体的演化脉络

从当前证据看，这条实体已经经历了一个很清楚的演化：

早期更像“能不能把生成与编辑放进同一个系统”。
中间阶段变成“统一训练是否能带来共享收益”。
到现在则进一步变成“是否可以把任务边界本身重新改写掉”，也就是把图像编辑、图像生成甚至视频生成看成同一更大系统里的不同操作模式。

也正因为如此，这个实体的意义已经不只是功能整合，而是平台形态重构。

当前关系网络

topics/image-generation 把这条路线放进生成主线，看它是否会成为图像系统默认平台。
topics/image-editing 则更关注统一路线是否真的能压过专用编辑器。
claims/claim-unified-models-may-outcompete-specialized-image-pipelines 负责持续判断它是否会在长期竞争里胜出。
questions/question-will-unified-image-models-sustain-their-advantage 则专门跟踪统一路线、专用路线与模块组合路线的长期分工边界。

证据

当前判断

目前这条主线已经不只是“做统一接口更方便”这么简单，而是在重新定义图像模型应该怎样被训练、怎样被组合、怎样被使用。统一模型是否一定能在峰值性能上全面超过专用系统，还没有定论；但它已经非常像未来图像系统的默认组织方式之一。

更稳的说法是：统一图像生成与编辑建模已经从一个方法方向，逐渐长成了一个平台级实体。