AnyDoor：零样本对象级图像定制

一句话结论

这篇工作把对象级定制能力推到零样本设定里，补强了图像生成主线中的可控定制分支。

问题定义

它要解决的是如何在无需额外训练的情况下，把一个给定对象自然地插入或定制到目标场景里。对当前知识库来说，它补的是 image-generation 与 image-editing 之间“对象级控制”这条非常实用的路线。

方法概述

AnyDoor 通过对象级条件控制，把参考对象和目标场景进行对齐与融合，强调零样本 object-level customization，使文本到图像/图像编辑系统具备更强的局部可控生成能力。

关键发现

它说明近三年图像生成的重要演化之一，是从全局 prompt 控制继续走向对象级、局部化、可组合控制。
它让图像生成与图像编辑的边界进一步模糊，因为很多定制能力本质上已经像编辑而不只是从零生成。
它为统一生成-编辑模型提供了现实压力：统一模型不仅要能整体生成，还要能处理对象级插入与替换。

局限或疑问

对象级定制的鲁棒性仍然容易受遮挡、尺度和复杂背景影响。
它强调零样本定制，但不等于已经解决更复杂的多对象交互编辑。
它更偏控制能力扩展，不直接回答统一模型长期是否一定占优。

原始链接

https://arxiv.org/abs/2307.09481
https://arxiv.org/pdf/2307.09481

备注

AnyDoor 在这套库里的作用，是把图像生成主线中的“对象级定制 / 零样本控制”补成明确分支。

元数据

{ "id": "2026-04-14-anydoor", "type": "source", "title": "AnyDoor（CVPR 2024）：零样本对象级图像定制", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "CVPR 2024", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "image-generation", "image-editing", "control", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Chen, Xi", "Huang, Lianghua", "Liu, Yu", "Shen, Yujun", "Zhao, Deli", "Zhao, Hengshuang" ], "published_at": "2023-07-18", "canonical_links": [ "https://arxiv.org/abs/2307.09481", "https://arxiv.org/pdf/2307.09481" ], "raw_entry": "raw/ingest/2026-04-14-anydoor/", "topics": [ "topics/image-generation", "topics/image-editing", "topics/vision-language" ], "entities": [ "entities/unified-image-generation-editing" ], "claims": [], "questions": [ "questions/question-will-unified-image-models-sustain-their-advantage" ] }

AnyDoor零样本对象级图像定制