探究扩散模型的前向扩散过程权重系数设计
创始人
2024-06-03 16:16:21
0

文章目录

      • 前言
      • 分析

前言

目前常见的前向扩散过程的公式表达如下:
xt=1−αt⋅xt−1+αt⋅ϵtx_t=\sqrt{1-\alpha_t}\cdot x_{t-1}+\sqrt{\alpha_t}\cdot\epsilon_txt​=1−αt​​⋅xt−1​+αt​​⋅ϵt​前段时间投稿一篇有关扩散模型的文章,被审稿人问道为什么要采用这种 1−αt+α\sqrt{1-\alpha_t}+\sqrt{\alpha}1−αt​​+α​ 的加权设计?遂前去搜寻资料和博客,大多数回答都讲是为了最终能够采样到高斯分布,但都不具体说原因。总不能这样给审稿人回复吧,怕不是分分钟被拒。因此,没有办法,只能自己研究一下原因。

先声明:奈何本人能力有限,这种方法只能算是一种探究,欢迎大家指正和交流。

分析

这里我不去关注使用这样加权的原因,而是关注使用不同加权方式分别会产生什么效果。首先我们假设存在 ata_tat​ 和 btb_tbt​ 满足:
xt=atxt−1+btϵt(1)x_t=a_t x_{t-1}+b_t \epsilon_t \tag{1}xt​=at​xt−1​+bt​ϵt​(1)
对上式按照递推的方式逐步展开得:
xt=atxt−1+btϵt=at(at−1xt−2+bt−1ϵt−1)+btϵt=at[at−1(at−2xt−3+bt−2ϵt−2)+bt−1ϵt−1]+btϵt=⋯⋯=(atat−1⋯a1)x0+(atat−1⋯a2)b1ϵ1+(atat−1⋯a3)b2ϵ2+⋯+atbt−1ϵt−1+btϵt\begin{equation*} \begin{aligned} x_t & = a_t x_{t-1}+ b_t \epsilon_t \\ ~ & = a_t \left(a_{t-1} x_{t-2}+b_{t-1} \epsilon_{t-1}\right)+ b_t \epsilon_t \\ ~ & = a_t\left[ a_{t-1} \left(a_{t-2} x_{t-3}+b_{t-2} \epsilon_{t-2}\right)+b_{t-1\epsilon_{t-1}}\right] + b_t\epsilon_t \\ ~ & = \cdots\cdots \\ ~ & = \left(a_ta_{t-1}\cdots a_1 \right)x_0+\left(a_ta_{t-1}\cdots a_2\right)b_1\epsilon_1+\left(a_ta_{t-1}\cdots a_3\right)b_2\epsilon_2+\cdots+a_tb_{t-1}\epsilon_{t-1}+b_t\epsilon_t \end{aligned} \end{equation*} xt​    ​=at​xt−1​+bt​ϵt​=at​(at−1​xt−2​+bt−1​ϵt−1​)+bt​ϵt​=at​[at−1​(at−2​xt−3​+bt−2​ϵt−2​)+bt−1ϵt−1​​]+bt​ϵt​=⋯⋯=(at​at−1​⋯a1​)x0​+(at​at−1​⋯a2​)b1​ϵ1​+(at​at−1​⋯a3​)b2​ϵ2​+⋯+at​bt−1​ϵt−1​+bt​ϵt​​​由于高斯噪声的叠加性质,当p∼N(0,σ12)p\sim \mathcal{N}(0, \sigma_1^2)p∼N(0,σ12​),q∼N(0,σ22)q\sim \mathcal{N}(0, \sigma_2^2)q∼N(0,σ22​)时,p+q∼N(0,σ12+σ22)p+q\sim \mathcal{N}(0, \sigma_1^2+\sigma_2^2)p+q∼N(0,σ12​+σ22​),而上式中的ϵi\epsilon_iϵi​均是标准高斯分布,即ϵi∼N(0,I)\epsilon_i\sim \mathcal{N}(0, \textbf{I})ϵi​∼N(0,I)。因此上式可以进一步简化为
xt=(atat−1⋯a1)x0+(atat−1⋯a2)b1ϵ1+(atat−1⋯a3)b2ϵ2+⋯+atbt−1ϵt−1+btϵt=(atat−1⋯a1)x0+(atat−1⋯a2)2b12+⋯+at2bt−12+bt2ϵ\begin{equation*} \begin{aligned} x_t & = \left(a_ta_{t-1}\cdots a_1 \right)x_0+\left(a_ta_{t-1}\cdots a_2\right)b_1\epsilon_1+\left(a_ta_{t-1}\cdots a_3\right)b_2\epsilon_2+\cdots+a_tb_{t-1}\epsilon_{t-1}+b_t\epsilon_t \\ ~ & = \left(a_ta_{t-1}\cdots a_1 \right)x_0 + \sqrt{\left(a_ta_{t-1}\cdots a_2\right)^2b_1^2+\cdots+a_t^2b_{t-1}^2+b_t^2}\epsilon\\ \end{aligned} \end{equation*} xt​ ​=(at​at−1​⋯a1​)x0​+(at​at−1​⋯a2​)b1​ϵ1​+(at​at−1​⋯a3​)b2​ϵ2​+⋯+at​bt−1​ϵt−1​+bt​ϵt​=(at​at−1​⋯a1​)x0​+(at​at−1​⋯a2​)2b12​+⋯+at2​bt−12​+bt2​​ϵ​​其中,ϵ∼N(0,I)\epsilon\sim\mathcal{N}(0, \textbf{I})ϵ∼N(0,I),根据扩散模型的参数设置可知 0 α‾t=atat−1⋯a1≈0\overline{\alpha}_t=a_ta_{t-1}\cdots a_1\approx 0 αt​=at​at−1​⋯a1​≈0,因此前向扩散过程能否收敛到一个标准高斯分布的判断就是噪声的系数能否收敛到1。对此,我这里分别判断三种加权方式下的收敛情况:

  1. at+bt=1a_t+b_t=1at​+bt​=1;
  2. at2+bt2=1a_t^2+b_t^2=1at2​+bt2​=1;
  3. at=bta_t=b_tat​=bt​。

这里取bt∈(0,1)b_t\in(0, 1)bt​∈(0,1),实际上是与原扩散模型保持一致,bt∈(0.0001,0.02)b_t\in(0.0001, 0.02)bt​∈(0.0001,0.02)。对于第一种情况,可以发现其在不同扩散步长时的收敛情况如图:
在这里插入图片描述
在这里插入图片描述
显然不论扩散步长如何设置,最终的噪声系数还是无法收敛到1,即前向扩散过程无法收敛为一个标准的高斯噪声分布。对于第二种加权方式,其在不同扩散步长时的收敛情况如图:
在这里插入图片描述
在这里插入图片描述
对于第二种加权方式,噪声分布的系数最终会收敛到1,而且过程是平稳的,时间无关的。同时,在选择第二种加权方式的时候,我们可以对噪声的系数表达式进行简化:
(atat−1⋯a2)2b12+⋯+at2bt−12+bt2=at2{at−12[at−22⋯⋯+bt−22]+bt−12}+bt2=at2{at−12[at−22⋯⋯+bt−22]+bt−12}+bt2=at2{at−12[at−22⋯⋯+bt−22]+bt−12}+bt2=at2{at−12[at−22⋯<1−a12a22>⋯+bt−22]+bt−12}+bt2⋯⋯=1−at2at−12at−22⋯a12\begin{equation*} \begin{aligned} ~ & \sqrt{\left(a_ta_{t-1}\cdots a_2\right)^2b_1^2+\cdots+a_t^2b_{t-1}^2+b_t^2}\\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots<1-a_1^2a_2^2>\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ ~ & \cdots\cdots \\ = & \sqrt{1-a_t^2a_{t-1}^2a_{t-2}^2\cdots a_1^2} \\ \end{aligned} \end{equation*}  ==== =​(at​at−1​⋯a2​)2b12​+⋯+at2​bt−12​+bt2​​at2​{at−12​[at−22​⋯⋯+bt−22​]+bt−12​}+bt2​​at2​{at−12​[at−22​⋯⋯+bt−22​]+bt−12​}+bt2​​at2​{at−12​[at−22​⋯⋯+bt−22​]+bt−12​}+bt2​​at2​{at−12​[at−22​⋯<1−a12​a22​>⋯+bt−22​]+bt−12​}+bt2​​⋯⋯1−at2​at−12​at−22​⋯a12​​​​显然这种加权方式所得的结果也更加优雅,从表达式可以直接看出其最终会收敛到1。对于第三种加权方式,不同扩散步长时的收敛情况如图:
在这里插入图片描述
在这里插入图片描述
很明显,这种加权方式是无法让噪声系数收敛到1的,也就无法令前向扩散过程收敛为一个标注的高斯分布。以下是我们做该部分仿真是用的 Python 代码:

import numpy as np
import matplotlib.pyplot as plt
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimSun'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题num = 100000b = np.linspace(0.0001, 0.02, num, dtype=np.float64)
a = np.sqrt(1 - np.square(b))
# a = b
# a = 1 - b
c = []
result = 0
for i in range(num):if i == 0:result = np.square(b[0])c.append(np.sqrt(result))else:result = np.square(a[i]) * result + np.square(b[i])c.append(np.sqrt(result))plt.figure()
plt.plot(range(num), c)
plt.xlabel('扩散步数')
plt.ylabel('噪声系数值')
plt.show()

虽然我们上边的方法从结果导向地解释了使用这种加权方式的合理性,但其具体的原因没有分析。而我作为一个初学者,也存在几个问题仍然存在疑惑,希望能与大家交流。

  • 为什么一定要前向扩散到一个标准高斯分布?
  • 为什么一定要加标准高斯噪声?

相关内容

热门资讯

你为什么不说话(精简6篇) 你为什么不说话 篇一在我们的生活中,总会遇到一些沉默寡言的人,他们不善于表达自己的情感和想法,给人一...
退化初一作文(推荐5篇) 退化初一作文 篇一退化初一作文 篇一我所见到的退化社会最近,我注意到了一个令人担忧的现象:社会正在逐...
这样多美丽作文600字_初一... 这样多美丽作文600字_初一作文 篇一梦幻花海梦幻花海是世界上最美丽的景色之一。当你踏入花海时,仿佛...
秋天来了初一作文(实用5篇) 秋天来了初一作文 篇一秋天的脚步悄悄地走进了我们的生活,初一的同学们也开始感受到了秋天的气息。在这个...
写大国工匠精神的作文(通用6... 写大国工匠精神的作文 篇一在当今社会,中国人民正以强烈的工匠精神推动着国家的发展。大国工匠精神是指在...
我的九月初一作文【优秀5篇】 我的九月初一作文 篇一初一的早晨,阳光透过窗户洒进了我的房间,唤醒了我美好的一天。这是我在新学校的第...
描写春天200字初一作文【优... 描写春天200字初一作文 篇一春天是一个美丽的季节,它给大地带来了新的生机和活力。当春天来临的时候,...
不再迷茫初中作文【优选6篇】 不再迷茫初中作文 篇一走出迷茫,迎接初中新生活初中生活对于许多同学来说是一个全新的开始,但同时也会让...
初一学生写的作文【优选6篇】 初一学生写的作文 篇一我的暑假生活暑假终于到了,这是我进入初中以来的第一个暑假。我期待这个假期已经很...
这也是失败的尝试初一作文(精... 这也是失败的尝试初一作文 篇一我的失败经历失败,对于每个人来说都是一种痛苦的经历。而我,也曾经历过一...
成长回眸作文(实用6篇) 成长回眸作文 篇一当我回眸自己的成长历程,我不禁感慨万分。从小到大,我经历了许多的挫折与困难,但也收...
再来一次,我要对你说出那句话... 再来一次,我要对你说出那句话初一作文 篇一第一篇内容再来一次,我要对你说出那句话记得那是一个阳光明媚...
一朵永不凋谢的六色花作文12... 一朵永不凋谢的六色花作文1200字 篇一一朵永不凋谢的六色花在一个幽静的小村庄里,有一位名叫小红的女...
姐姐出嫁作文(优质5篇) 姐姐出嫁作文 篇一姐姐出嫁是人生中一段重要的时刻,它不仅意味着姐姐将和自己的另一半共度一生,更是家庭...
初中作文窗外600字【精简6... 初中作文窗外600字 篇一窗外的四季窗外是一个神奇的世界,它随着四季的更替,展现出不同的景象和色彩。...
初中议论文作文600字【优秀... 初中议论文作文600字 篇一"手机禁用,营造宁静学习环境"如今,手机已经成为人们生活中不可或缺的一部...
我的中国梦作文600字初一(... 我的中国梦作文600字初一 篇一我的中国梦作为一个中国人,我有着自己的中国梦。中国梦,是每个中国人对...
我的年度关键词旅游作文【实用... 我的年度关键词旅游作文 篇一我今年的关键词是“自然”,因此我选择去探索大自然的奇妙之处。我决定去一座...
你好初一优秀作文49篇(优秀... 你好初一优秀作文49篇 篇一初中生活的收获与感悟初中三年的时光匆匆而过,回首看来,这三年是我成长最快...
哑剧表演初一作文【最新6篇】 哑剧表演初一作文 篇一哑剧表演初一作文 篇一哑剧表演是一种没有语言交流的表演形式,通过动作、表情和肢...