DeepCache（CVPR 2024）：用特征缓存免费加速扩散模型

会议：CVPR 2024

发表日期：2023/12/01

资料加入日期：2026-04-15

一句话结论

这篇论文把扩散提速问题从“重训模型”转到“缓存时序冗余”，说明不少速度收益其实可以直接从推理结构里白拿。

它要解决的是扩散模型逐步去噪导致的高计算成本。传统加速路线往往依赖蒸馏、剪枝或重训练，但这些方法本身就昂贵、难迁移。对当前 wiki 来说，DeepCache 补的是 diffusion inference engineering 的关键节点：不改权重、少改流程，也能显著提升吞吐。

DeepCache 的核心是利用相邻去噪步之间的时序冗余，对高层特征做缓存与复用，只廉价更新低层特征。它站在模型结构视角而不是采样器数学视角来加速，因此能和现有采样方法兼容。

它说明 diffusion efficiency 主线里，“训练免费”的工程优化是独立且很强的一条路线。
它和 sources/2026-04-15-act-diffusion 构成训练侧/推理侧的清晰对照，帮助 topics/diffusion-models 区分不同效率策略。
它也解释了为什么很多实际系统会优先做缓存、复用和管线工程，而不是一开始就选择重训练式压缩。

在这套库里，DeepCache 的意义非常工程化：它让“扩散为什么还能继续部署下去”这件事有了更强解释，因为速度问题未必都要靠新模型解决，很多时候先靠系统层手段就能明显缓解。