ReCo：区域控制的文本到图像生成

一句话结论

这篇工作把 region-controlled text-to-image generation 补进库里，强化了 image-generation 里的区域级控制路线。

问题定义

它要解决的是文本到图像生成缺少稳定区域级控制接口的问题。对当前知识库来说，它能很好补足 GLIGEN、LayoutDiffusion 之外另一条更直接的区域控制支线。

方法概述

ReCo 通过 region-controlled 方式实现 text-to-image generation，让模型能够围绕指定区域执行更精确的条件生成。

关键发现

它让 image-generation 的控制谱系从 layout、grounding、object customization 继续延伸到 region-level control。
它为后续比较不同控制接口的粒度与可用性提供了更直接样本。
它也让 vision-language 页对区域条件接口的覆盖更完整。

局限或疑问

区域控制并不自动解决更复杂的组合语义生成。
它更偏控制接口补层，不直接回答统一多任务模型长期优劣。
它是高价值控制节点，但不是个性化/编辑统一路线本身。

原始链接

https://arxiv.org/abs/2211.15518
https://arxiv.org/pdf/2211.15518

备注

ReCo 在这套库里的作用，是把区域控制文本到图像生成路线补成明确分支。

元数据

{ "id": "2026-04-14-reco", "type": "source", "title": "ReCo（CVPR 2023）：区域控制的文本到图像生成", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "CVPR 2023", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "image-generation", "control", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Yang, Zhengyuan", "Wang, Jianfeng", "Gan, Zhe", "Li, Linjie", "Lin, Kevin", "Wu, Chenfei", "Duan, Nan", "Liu, Zicheng", "Liu, Ce", "Zeng, Michael", "Wang, Lijuan" ], "published_at": "2022/11/23", "canonical_links": [ "https://arxiv.org/abs/2211.15518", "https://arxiv.org/pdf/2211.15518" ], "raw_entry": "raw/ingest/2026-04-14-reco/", "topics": [ "topics/image-generation", "topics/vision-language" ], "entities": [ "entities/unified-image-generation-editing" ], "claims": [], "questions": [ "questions/question-will-unified-image-models-sustain-their-advantage" ] }

ReCo区域控制的文本到图像生成