ArticleMetadataMain page

source · 2026-04-15

Imagen Editor 与 EditBench(CVPR 2023):推进并评测文本引导图像修补

Imagen Editor 与 EditBench(CVPR 2023):推进并评测文本引导图像修补

会议:CVPR 2023
发表日期:2022-12-13
资料加入日期:2026-04-14

一句话结论

这篇工作把“编辑模型”和“编辑 benchmark”同时推进,说明图像编辑不只是方法问题,也已经进入系统化评测阶段。

问题定义

它要解决的是文本引导图像修补里两个核心问题:一是编辑结果如何既跟随文本又尽量保住原图细节;二是这类编辑能力到底应该如何稳定评测。对当前知识库来说,它同时补了 image-editing 方法线与 evaluation 评测线。

方法概述

作者在 Imagen 基础上微调出 Imagen Editor,用 object detector 产生训练时的修补 mask,并在级联扩散流程里继续保留原始高分辨率图像条件。同时提出 EditBench,用自然图像和生成图像上的对象、属性、场景编辑来系统评估文本引导图像修补。

关键发现

  • 它说明高质量图像编辑早期就已经明显依赖“训练数据/训练协议 + 编辑评测设计”的联动,而不只是推理时的小技巧。
  • 它把 EditBench 作为显式 benchmark 推上台面,说明图像编辑能力评估本身已经是独立问题。
  • 它为后续统一生成-编辑系统提供了一个重要参照:不仅要会编辑,还要能被可重复地评测。

局限或疑问

  • 它更偏向图像修补场景,不等于覆盖全部 instruction-based image editing。
  • 评测主要围绕 text-guided inpainting,和更开放的多类型编辑任务仍有距离。
  • 它是重要锚点,但还不能回答统一模型长期一定优于专用流水线。

原始链接

  • https://arxiv.org/abs/2212.06909
  • https://arxiv.org/pdf/2212.06909

相关页面

备注

Imagen Editor / EditBench 在这套库里的价值,是把图像编辑主线中的“方法推进”和“专门 benchmark 建立”接到同一历史节点上。