【AICG】2、扩散模型 | 到底什么是扩散模型?
创始人
2024-06-01 11:12:37
0

文章目录

    • 一、什么是扩散模型
    • 二、扩散模型相关定义
      • 2.1 符号和定义
      • 2.2 问题规范化
    • 三、可以提升的点

参考论文:A Survey on Generative Diffusion Model

github:https://github.com/chq1155/A-Survey-on-Generative-Diffusion-Model

一、什么是扩散模型

已经有大量的方法证明深度生成模型能够模拟人类的想象思维,生成人类难以分辨真伪的内容,主要方法如下:

  • VAE:依赖于替代损失
  • EBM
  • GAN:因其对抗性训练性质而以潜在的不稳定训练和较少的生成多样性而闻名
  • diffusion model

在这里插入图片描述

我们主要介绍扩散模型,扩散模型背后的直觉来源于物理学:

  • 在物理学中,气体分子从高浓度区域扩散到低浓度区域
  • 这与由于噪声的干扰而导致的信息丢失是相似的
  • 通过引入噪声,然后尝试去噪来生成图像,模型每次在给定一些噪声输入的情况下学习生成新图像。

扩散模型可以用到哪些任务上:

  • 计算机视觉
  • 语言模型
  • 声音模型
  • AI for science

扩散模型的应用场景:

  • 图文生成
  • 视频生成
  • 分子结构生成
  • AI 绘画
  • AI 制药

扩散模型的工作原理:

  • 学习由于噪声引起的信息衰减,然后使用学习到的模式来生成图像

扩散模型的结构:

  • 扩散模型定义了一个扩散步骤的马尔可夫链,慢慢地向数据中添加随机噪声,然后学习反向扩散过程,从噪声中构建所需的数据样本
  • 前向扩散过程:为输入图像 x0x_0x0​ 引入一系列的随机噪声,也就是对样本点分 T 步添加高斯噪声,随着噪声的引入,x0x_0x0​ 最终会失去区分特性,
  • 反向恢复过程:从高斯先验出发,从有大量随机噪声的图中学习恢复原图

前向过程:

在这里插入图片描述

扩散模型相比 GAN 或 VAE 的缺点:

  • 速度慢:扩散模型是基于马尔科夫过程来实现的,在训练和推理的时候都需要很多步骤

在这里插入图片描述

二、扩散模型相关定义

2.1 符号和定义

1、State:状态

State 是能够描述整个扩散模型过程的一系列数据:

  • 初始状态:starting state x0x_0x0​
  • prior state:离散时为 xTx_TxT​,连续时为 x1x_1x1​
  • 中间状态:intermediate state xtx_txt​

2、Process 和 Transition Kernel

  • Forward/Diffusion 过程 FFF:将初始状态转换到有噪声的状态
  • Reverse/Denoised 过程 RRR:和前向过程方向相反,从有噪声的图像中逐步复原原图的过程
  • Transition Kernel:在上面的两个过程中,每两个 state 的变换都是通过 transition kernel 来实现的,

前向和逆向的过程如下所示:

在这里插入图片描述

对于非离散情况,任何时间 0<=t

在这里插入图片描述

  • FtF_tFt​ 和 RtR_tRt​ 分别是 ttt 时刻从状态 xt−1x_{t-1}xt−1​ 转换成状态 xtx_txt​ 的前向 transition kernel 和逆向 transition kernel
  • σt\sigma_tσt​ 是噪声尺度
  • 最常用的 transition kernel 是 Markov kernel,因为其具有较好的任意性和可控性

3、Pipeline:

假设定义 sampled data 为 x~0\widetilde{x}_0x0​,则整个过程可以描述如下:

在这里插入图片描述

4、离散和连续过程

与离散过程相比,连续过程能够从任何时间状态中提取任何信息

如果扰动核的变化足够小,则连续过程有更好的理论支撑

5、训练目标

扩散模型是生成模型的一个子类,和 VAE 的目标函数类似,目标是让初始分布 x0x_0x0​ 和采样分布 x~0\widetilde{x}_0x0​ 尽可能的接近。

通过最大化如下 log-likelihood 公式来实现,其中 σ~\widetilde{\sigma}σ 在前向和逆向过程中是不同的:

在这里插入图片描述

2.2 问题规范化

1、Denoised Diffusion Probabilistic Model(DDPM):去噪扩散概率模型

NIPS 2021 的论文 ‘Denoising diffusion probabilistic models’ 中对扩散概率模型进行了改进,提出了 DDPM:

  • 使用固定的方差回归均值
  • 用和噪声表示,通过均值预测网络重参数化,将关于均值的差改写为噪声预测网络与噪声的差,将目标函数改写为噪声预测的方式
  • 对高斯噪声进行回归预测
  • 对扩散模型的架构也进行了相应的改进,使用 U-Net 形式的架构,引入了跳跃连接,更适合于像素级别的预测任务

DDPM Forward Process:

  • DDPM 使用一系列的噪声系数 β1\beta_1β1​、β2\beta_2β2​ … βT\beta_TβT​ 作为不同时刻的 Markov trasition kernel。

  • 一般都使用常数、线性规则、cosine 规则 来选择噪声系数,而且 [68] 中也证明了不同的噪声系数在实验中也没有明显的影响

  • DDPM 的前向过程定义如下:

    在这里插入图片描述

  • 根据从 x0x_0x0​ 到 xTx_TxT​ 的扩散步骤, Forward Diffusion Process 如下:

    在这里插入图片描述

DDPM Reverse Process:

  • 逆向过程使用可学习的 Gaussian trasition 参数 θ\thetaθ 来定义如下:

    在这里插入图片描述

  • 逐步从 xTx_TxT​ 复原到 x0x_0x0​ 的过程如下,假设过程为 p(xT)=N(xT;0,I)p(x_T) = N(x_T;\ 0, I)p(xT​)=N(xT​; 0,I):

    在这里插入图片描述

  • 所以,pθ(x0)=∫pθ(x0:T)dx1:Tp_{\theta}(x_0)=\int p_{\theta}(x_{0:T})dx_{1:T}pθ​(x0​)=∫pθ​(x0:T​)dx1:T​ 的分布就是 x~0\widetilde{x}_0x0​ 的分布

Diffusion Training Objective:为了最小化 negative log-likelihood (NLL),则最小化问题转换为:

在这里插入图片描述

  • LTL_TLT​:prior loss
  • L0L_0L0​:reconstruction loss
  • L1:T−1L_{1:T-1}L1:T−1​:consistent loss

下图是 PPDM 的 pipeline:

在这里插入图片描述

2、Score Matching Formulation

score matching 模型是为了解决原始数据分布的估计问题,通过近似数据的梯度 ∇xlogp(x)\nabla_xlogp(x)∇x​logp(x) 来实现,这也称为 score。

两个相邻状态的 transition kernel 为:

在这里插入图片描述

Score matching 过程:

score matching 的核心是训练一个得分估计网络 sθ(x,σ)s_{\theta}(x, \sigma)sθ​(x,σ) 来预测得分。
在这里插入图片描述

DSM:

在这里插入图片描述

在这里插入图片描述

三、可以提升的点

尽管扩散模型目前取得了很好的生成效果,到其逐步去噪的过程涉及非常多的迭代步骤,故此扩散模型的加速是很重要的研究课题。

在这里插入图片描述

相关内容

热门资讯

襄邑道中经典古诗阅读答案 襄邑道中经典古诗阅读答案  【原文】  襄邑道中  陈与义  飞花两岸照船红,百里榆堤半日风。  卧...
李白《秋浦歌》译文及赏析 李白《秋浦歌》译文及赏析  《秋浦歌十七首》是唐代伟大诗人李白的组诗作品。这组诗创作于唐玄宗天宝年间...
目送征鸿飞杳杳,思随流水去茫... “目送征鸿飞杳杳,思随流水去茫茫。”出处 出自 五代 孙光宪 的《浣溪沙·蓼岸风多橘柚香》“目送征鸿...
庄周梦蝶古诗 庄周梦蝶古诗  每日每夜,我依靠着忙碌的步履,在桌台上敲击着零散的字母,也许我是想建筑一座宏伟的堡垒...
白居易描写春天的诗句 白居易描写春天的诗句  在生活、工作和学习中,大家肯定对各类诗句都很熟悉吧,诗句节奏上鲜明有序,音谐...
《感遇》张九龄全文 《感遇十二首》张九龄全文  《感遇十二首》这组诗托物寓意,抒发了作者的身世感慨,表现了作者的理想操守...
藕花珠缀,犹似汗凝妆 “藕花珠缀,犹似汗凝妆。”出处 出自 五代 阎选 的《临江仙·雨停荷芰逗浓香》“藕花珠缀,犹似汗凝妆...
观沧海赏析200字   观沧海  东临碣石,以观沧海。  水何澹澹,山岛竦峙。  树木丛生,百草丰茂。  秋风萧瑟,洪波...
三行情诗 三行情诗汇编  情诗,抒发男女间爱情的诗,尤指男人对女人的诗,是诗的一种,是爱情表达的一种形式。简单...
爱情的古诗词 有关爱情的古诗词25首  导语:荷叶生时春恨生,荷叶枯时秋恨成。深知身在情长在,怅望江头江水声。下面...
《饮湖上初晴后雨》古诗意思 《饮湖上初晴后雨》古诗意思  在诗作《饮湖上初晴后雨》中,体现诗人苏轼对于西湖的喜爱之情。饮湖上初晴...
写桃花的诗句有哪些 写桃花的诗句有哪些  桃花是非常美丽的植物,下面就是小编为您收集整理的'写桃花的诗句有哪些的相关文章...
表达思乡情的诗句 表达思乡情的诗句  1、离愁渐远渐无穷,迢迢不断如春水。——欧阳修  2、谁家玉笛暗飞声,散入春风满...
元稹《离思·其四》 元稹《离思五首·其四》  元稹的《离思五首·其四》最突出的特色,就是采用巧比曲喻的手法,淋漓尽致地表...
描写时间的诗句 描写时间的诗句  1、少壮不努力,老大徒伤悲。  2、一日无二晨,时间不重临。  3、为君聊赋今日诗...
《成都府》杜甫 《成都府》杜甫  成都府  杜甫  翳翳桑榆日,照我征衣裳。  我行山川异,忽在天一方。  但逢新人...
描写三秋的诗句 描写三秋的诗句  (一)  秋风昨夜过江阴,吹谢菊花满地金;  几朵乌云堆雨意,一天黄叶落河心。  ...
七夕节诗句 七夕节诗句  在生活、工作和学习中,大家都听说过或者使用过一些比较经典的'诗句吧,诗句能使人们自然而...
青溪 王维 答案 青溪 王维 答案 青溪 王维 答案,这是一首五言古诗,不是律诗,更不是绝句,在这首五言12句诗中,作...
故人具鸡黍,邀我至田家 “故人具鸡黍,邀我至田家。”出处 出自 唐代 孟浩然 的《过故人庄》“故人具鸡黍,邀我至田家。”全诗...