用于文本驱动图像编辑的 Prompt Tuning Inversion

一句话结论

这篇工作把 prompt tuning 接进 inversion 过程，补强了真实图像编辑里“如何更好进入可编辑空间”的另一条技术线。

问题定义

它要解决的是文本驱动图像编辑中，真实图像反演后仍可能不够好编辑、不够稳定的问题。对当前知识库来说，它补的是 inversion 机制进一步细化为 prompt tuning 路线的节点。

方法概述

Prompt Tuning Inversion 通过对 prompt 或相关条件进行调优，帮助真实图像在扩散模型中获得更适合后续文本编辑的可编辑表示。

关键发现

它说明真实图像编辑并不是单靠一次反演就结束，而是可以围绕条件表示继续优化。
它让 inversion 主线进一步分叉出 prompt-level 调整，而不只是 latent-level 反演。
它与 NULL-Text Inversion、Effective Real Image Editing 一起，构成了 image-editing 近三年里很重要的机制改进簇。

局限或疑问

这一路线更偏底层机制调优，对最终任务表达的帮助需要结合具体编辑任务看。
它可能增加编辑链条的复杂度。
它仍然属于扩散式真实图像编辑范式内部优化。

原始链接

https://arxiv.org/abs/2305.04441
https://arxiv.org/pdf/2305.04441

备注

Prompt Tuning Inversion 在这套库里的意义，是把真实图像编辑里的 prompt-level inversion 改进补成独立节点。

元数据

{ "id": "2026-04-14-prompt-tuning-inversion", "type": "source", "title": "用于文本驱动图像编辑的 Prompt Tuning Inversion（ICCV 2023）", "status": "reviewed", "created": "2026-04-14", "updated": "2026-04-15", "venue": "ICCV 2023", "ingested_at": "2026-04-14", "tags": [ "near-cvpr-2025", "image-editing", "diffusion", "primary-source" ], "note_status": "reviewed", "source_type": "paper", "authors": [ "Dong, Wenkai", "Xue, Song", "Duan, Xiaoyue", "Han, Shumin" ], "published_at": "2023/05/08", "canonical_links": [ "https://arxiv.org/abs/2305.04441", "https://arxiv.org/pdf/2305.04441" ], "raw_entry": "raw/ingest/2026-04-14-prompt-tuning-inversion/", "topics": [ "topics/image-editing", "topics/diffusion-models" ], "entities": [ "entities/unified-image-generation-editing" ], "claims": [], "questions": [ "questions/question-data-vs-architecture-in-image-editing" ] }