探究扩散模型的前向扩散过程权重系数设计
创始人
2024-06-03 16:16:21
0

文章目录

      • 前言
      • 分析

前言

目前常见的前向扩散过程的公式表达如下:
xt=1−αt⋅xt−1+αt⋅ϵtx_t=\sqrt{1-\alpha_t}\cdot x_{t-1}+\sqrt{\alpha_t}\cdot\epsilon_txt​=1−αt​​⋅xt−1​+αt​​⋅ϵt​前段时间投稿一篇有关扩散模型的文章,被审稿人问道为什么要采用这种 1−αt+α\sqrt{1-\alpha_t}+\sqrt{\alpha}1−αt​​+α​ 的加权设计?遂前去搜寻资料和博客,大多数回答都讲是为了最终能够采样到高斯分布,但都不具体说原因。总不能这样给审稿人回复吧,怕不是分分钟被拒。因此,没有办法,只能自己研究一下原因。

先声明:奈何本人能力有限,这种方法只能算是一种探究,欢迎大家指正和交流。

分析

这里我不去关注使用这样加权的原因,而是关注使用不同加权方式分别会产生什么效果。首先我们假设存在 ata_tat​ 和 btb_tbt​ 满足:
xt=atxt−1+btϵt(1)x_t=a_t x_{t-1}+b_t \epsilon_t \tag{1}xt​=at​xt−1​+bt​ϵt​(1)
对上式按照递推的方式逐步展开得:
xt=atxt−1+btϵt=at(at−1xt−2+bt−1ϵt−1)+btϵt=at[at−1(at−2xt−3+bt−2ϵt−2)+bt−1ϵt−1]+btϵt=⋯⋯=(atat−1⋯a1)x0+(atat−1⋯a2)b1ϵ1+(atat−1⋯a3)b2ϵ2+⋯+atbt−1ϵt−1+btϵt\begin{equation*} \begin{aligned} x_t & = a_t x_{t-1}+ b_t \epsilon_t \\ ~ & = a_t \left(a_{t-1} x_{t-2}+b_{t-1} \epsilon_{t-1}\right)+ b_t \epsilon_t \\ ~ & = a_t\left[ a_{t-1} \left(a_{t-2} x_{t-3}+b_{t-2} \epsilon_{t-2}\right)+b_{t-1\epsilon_{t-1}}\right] + b_t\epsilon_t \\ ~ & = \cdots\cdots \\ ~ & = \left(a_ta_{t-1}\cdots a_1 \right)x_0+\left(a_ta_{t-1}\cdots a_2\right)b_1\epsilon_1+\left(a_ta_{t-1}\cdots a_3\right)b_2\epsilon_2+\cdots+a_tb_{t-1}\epsilon_{t-1}+b_t\epsilon_t \end{aligned} \end{equation*} xt​    ​=at​xt−1​+bt​ϵt​=at​(at−1​xt−2​+bt−1​ϵt−1​)+bt​ϵt​=at​[at−1​(at−2​xt−3​+bt−2​ϵt−2​)+bt−1ϵt−1​​]+bt​ϵt​=⋯⋯=(at​at−1​⋯a1​)x0​+(at​at−1​⋯a2​)b1​ϵ1​+(at​at−1​⋯a3​)b2​ϵ2​+⋯+at​bt−1​ϵt−1​+bt​ϵt​​​由于高斯噪声的叠加性质,当p∼N(0,σ12)p\sim \mathcal{N}(0, \sigma_1^2)p∼N(0,σ12​),q∼N(0,σ22)q\sim \mathcal{N}(0, \sigma_2^2)q∼N(0,σ22​)时,p+q∼N(0,σ12+σ22)p+q\sim \mathcal{N}(0, \sigma_1^2+\sigma_2^2)p+q∼N(0,σ12​+σ22​),而上式中的ϵi\epsilon_iϵi​均是标准高斯分布,即ϵi∼N(0,I)\epsilon_i\sim \mathcal{N}(0, \textbf{I})ϵi​∼N(0,I)。因此上式可以进一步简化为
xt=(atat−1⋯a1)x0+(atat−1⋯a2)b1ϵ1+(atat−1⋯a3)b2ϵ2+⋯+atbt−1ϵt−1+btϵt=(atat−1⋯a1)x0+(atat−1⋯a2)2b12+⋯+at2bt−12+bt2ϵ\begin{equation*} \begin{aligned} x_t & = \left(a_ta_{t-1}\cdots a_1 \right)x_0+\left(a_ta_{t-1}\cdots a_2\right)b_1\epsilon_1+\left(a_ta_{t-1}\cdots a_3\right)b_2\epsilon_2+\cdots+a_tb_{t-1}\epsilon_{t-1}+b_t\epsilon_t \\ ~ & = \left(a_ta_{t-1}\cdots a_1 \right)x_0 + \sqrt{\left(a_ta_{t-1}\cdots a_2\right)^2b_1^2+\cdots+a_t^2b_{t-1}^2+b_t^2}\epsilon\\ \end{aligned} \end{equation*} xt​ ​=(at​at−1​⋯a1​)x0​+(at​at−1​⋯a2​)b1​ϵ1​+(at​at−1​⋯a3​)b2​ϵ2​+⋯+at​bt−1​ϵt−1​+bt​ϵt​=(at​at−1​⋯a1​)x0​+(at​at−1​⋯a2​)2b12​+⋯+at2​bt−12​+bt2​​ϵ​​其中,ϵ∼N(0,I)\epsilon\sim\mathcal{N}(0, \textbf{I})ϵ∼N(0,I),根据扩散模型的参数设置可知 0 α‾t=atat−1⋯a1≈0\overline{\alpha}_t=a_ta_{t-1}\cdots a_1\approx 0 αt​=at​at−1​⋯a1​≈0,因此前向扩散过程能否收敛到一个标准高斯分布的判断就是噪声的系数能否收敛到1。对此,我这里分别判断三种加权方式下的收敛情况:

  1. at+bt=1a_t+b_t=1at​+bt​=1;
  2. at2+bt2=1a_t^2+b_t^2=1at2​+bt2​=1;
  3. at=bta_t=b_tat​=bt​。

这里取bt∈(0,1)b_t\in(0, 1)bt​∈(0,1),实际上是与原扩散模型保持一致,bt∈(0.0001,0.02)b_t\in(0.0001, 0.02)bt​∈(0.0001,0.02)。对于第一种情况,可以发现其在不同扩散步长时的收敛情况如图:
在这里插入图片描述
在这里插入图片描述
显然不论扩散步长如何设置,最终的噪声系数还是无法收敛到1,即前向扩散过程无法收敛为一个标准的高斯噪声分布。对于第二种加权方式,其在不同扩散步长时的收敛情况如图:
在这里插入图片描述
在这里插入图片描述
对于第二种加权方式,噪声分布的系数最终会收敛到1,而且过程是平稳的,时间无关的。同时,在选择第二种加权方式的时候,我们可以对噪声的系数表达式进行简化:
(atat−1⋯a2)2b12+⋯+at2bt−12+bt2=at2{at−12[at−22⋯⋯+bt−22]+bt−12}+bt2=at2{at−12[at−22⋯⋯+bt−22]+bt−12}+bt2=at2{at−12[at−22⋯⋯+bt−22]+bt−12}+bt2=at2{at−12[at−22⋯<1−a12a22>⋯+bt−22]+bt−12}+bt2⋯⋯=1−at2at−12at−22⋯a12\begin{equation*} \begin{aligned} ~ & \sqrt{\left(a_ta_{t-1}\cdots a_2\right)^2b_1^2+\cdots+a_t^2b_{t-1}^2+b_t^2}\\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ = & \sqrt{a_t^2\{a_{t-1}^2 \left[a_{t-2}^2\cdots<1-a_1^2a_2^2>\cdots+b_{t-2}^2 \right]+b_{t-1}^2\}+b_t^2} \\ ~ & \cdots\cdots \\ = & \sqrt{1-a_t^2a_{t-1}^2a_{t-2}^2\cdots a_1^2} \\ \end{aligned} \end{equation*}  ==== =​(at​at−1​⋯a2​)2b12​+⋯+at2​bt−12​+bt2​​at2​{at−12​[at−22​⋯⋯+bt−22​]+bt−12​}+bt2​​at2​{at−12​[at−22​⋯⋯+bt−22​]+bt−12​}+bt2​​at2​{at−12​[at−22​⋯⋯+bt−22​]+bt−12​}+bt2​​at2​{at−12​[at−22​⋯<1−a12​a22​>⋯+bt−22​]+bt−12​}+bt2​​⋯⋯1−at2​at−12​at−22​⋯a12​​​​显然这种加权方式所得的结果也更加优雅,从表达式可以直接看出其最终会收敛到1。对于第三种加权方式,不同扩散步长时的收敛情况如图:
在这里插入图片描述
在这里插入图片描述
很明显,这种加权方式是无法让噪声系数收敛到1的,也就无法令前向扩散过程收敛为一个标注的高斯分布。以下是我们做该部分仿真是用的 Python 代码:

import numpy as np
import matplotlib.pyplot as plt
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimSun'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题num = 100000b = np.linspace(0.0001, 0.02, num, dtype=np.float64)
a = np.sqrt(1 - np.square(b))
# a = b
# a = 1 - b
c = []
result = 0
for i in range(num):if i == 0:result = np.square(b[0])c.append(np.sqrt(result))else:result = np.square(a[i]) * result + np.square(b[i])c.append(np.sqrt(result))plt.figure()
plt.plot(range(num), c)
plt.xlabel('扩散步数')
plt.ylabel('噪声系数值')
plt.show()

虽然我们上边的方法从结果导向地解释了使用这种加权方式的合理性,但其具体的原因没有分析。而我作为一个初学者,也存在几个问题仍然存在疑惑,希望能与大家交流。

  • 为什么一定要前向扩散到一个标准高斯分布?
  • 为什么一定要加标准高斯噪声?

相关内容

热门资讯

常用商务英语口语   商务英语是以适应职场生活的语言要求为目的,内容涉及到商务活动的方方面面。下面是小编收集的常用商务...
六年级上册英语第一单元练习题   一、根据要求写单词。  1.dry(反义词)__________________  2.writ...
复活节英文怎么说 复活节英文怎么说?复活节的英语翻译是什么?复活节:Easter;"Easter,anniversar...
2008年北京奥运会主题曲 2008年北京奥运会(第29届夏季奥林匹克运动会),2008年8月8日到2008年8月24日在中华人...
英语道歉信 英语道歉信15篇  在日常生活中,道歉信的使用频率越来越高,通过道歉信,我们可以更好地解释事情发生的...
六年级英语专题训练(连词成句... 六年级英语专题训练(连词成句30题)  1. have,playhouse,many,I,toy,i...
上班迟到情况说明英语   每个人都或多或少的迟到过那么几次,因为各种原因,可能生病,可能因为交通堵车,可能是因为天气冷,有...
小学英语教学论文 小学英语教学论文范文  引导语:英语教育一直都是每个家长所器重的,那么有关小学英语教学论文要怎么写呢...
英语口语学习必看的方法技巧 英语口语学习必看的方法技巧如何才能说流利的英语? 说外语时,我们主要应做到四件事:理解、回答、提问、...
四级英语作文选:Birth ... 四级英语作文范文选:Birth controlSince the Chinese Governmen...
金融专业英语面试自我介绍 金融专业英语面试自我介绍3篇  金融专业的学生面试时,面试官要求用英语做自我介绍该怎么说。下面是小编...
我的李老师走了四年级英语日记... 我的李老师走了四年级英语日记带翻译  我上了五个学期的小学却换了六任老师,李老师是带我们班最长的语文...
小学三年级英语日记带翻译捡玉... 小学三年级英语日记带翻译捡玉米  今天,我和妈妈去外婆家,外婆家有刚剥的`玉米棒上带有玉米籽,好大的...
七年级英语优秀教学设计 七年级英语优秀教学设计  作为一位兢兢业业的人民教师,常常要写一份优秀的教学设计,教学设计是把教学原...
我的英语老师作文 我的英语老师作文(通用21篇)  在日常生活或是工作学习中,大家都有写作文的经历,对作文很是熟悉吧,...
英语老师教学经验总结 英语老师教学经验总结(通用19篇)  总结是指社会团体、企业单位和个人对某一阶段的学习、工作或其完成...
初一英语暑假作业答案 初一英语暑假作业答案  英语练习一(基础训练)第一题1.D2.H3.E4.F5.I6.A7.J8.C...
大学生的英语演讲稿 大学生的英语演讲稿范文(精选10篇)  使用正确的写作思路书写演讲稿会更加事半功倍。在现实社会中,越...
VOA美国之音英语学习网址 VOA美国之音英语学习推荐网址 美国之音网站已经成为语言学习最重要的资源站点,在互联网上还有若干网站...
商务英语期末试卷 Part I Term Translation (20%)Section A: Translate ...