粗-细潜扩散(Coarse-to-Fine Latent Diffusion,CFLD)是一种用于姿态引导人像合成的多阶段策略方法。该方法通过先生成粗略草图,再逐步细化,以提高生成图像的质量和准确性。具体来说,CFLD方法在没有图像-文本配对和文本提示的情况下,开发了一种纯粹基于图像的训练范式,用于控制预训练文本到图像扩散模型的生成过程。这种方法还设计了一个感知优化的解码器,以进一步提升生成图像的效果