Diffusion
OpenAI的Lilian Weng博客的一系列文章:
- GAN:From GAN to WGAN | Lil'Log (lilianweng.github.io)
- VAE:From Autoencoder to Beta-VAE | Lil'Log (lilianweng.github.io)
- Diffusion:What are Diffusion Models? | Lil'Log (lilianweng.github.io)
大一统:[2208.11970] Understanding Diffusion Models: A Unified Perspective (arxiv.org)
DDPM
论文链接:[2006.11239] Denoising Diffusion Probabilistic Models (arxiv.org)
NCSN
论文链接:[1907.05600] Generative Modeling by Estimating Gradients of the Data Distribution (arxiv.org)
一个知乎:图像生成别只知道扩散模型(Diffusion Models),还有基于梯度去噪的分数模型:NCSN(Noise Conditional Score Networks) - 知乎 (zhihu.com)
CondInstanceNorm++:特殊的instance normalization,保持单像素信息不偏差
U-Net
知乎文章里最后的条件生成没看太懂,也没找到出处。
Score-based SDE
论文链接:[2011.13456] Score-Based Generative Modeling through Stochastic Differential Equations (arxiv.org)
原作者博客:Generative Modeling by Estimating Gradients of the Data Distribution | Yang Song (yang-song.net)
其中有个挺好的可以直接跑的Lab:Tutorial on Score-Based Generative Modeling (PyTorch).ipynb - Colaboratory (google.com)
扩散模型与能量模型,Score-Matching和SDE,ODE的关系 - 知乎 (zhihu.com)
Score-based Generative Models总结 - 知乎 (zhihu.com)
DDIM
论文链接:[2010.02502] Denoising Diffusion Implicit Models (arxiv.org)
跳步训练,减少训练成本,在少量训练情况下比DDPM好。
去除了噪声分布的方差,使得过程确定,和特征有更好的对应,从而可以插值。
LDM
论文链接:[2112.10752] High-Resolution Image Synthesis with Latent Diffusion Models (arxiv.org)
把Diffusion跑在latent上,减少训练成本。