导语
最近AI绘画应用如火如荼,
有关算法的应用产品也很多,比如DALLE2
官网地址:https://openai.com/dall-e-2/
DALLE2产品描述:DALL·E2是一个新的人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术
其主要功能有:
DALLE 2可以从文本描述中创建原创、逼真的图像和艺术。它可以组合概念、属性和样式。
DALLE 2可以通过自然语言字幕对现有图像进行逼真的编辑。它可以添加和删除元素,同时考虑阴影、反射和纹理。
DALLE 2可以将图像扩展到原始画布之外,创造出更广阔的新构图
DALLE 2可以创建不同的灵感来源于原作。
1.为什么叫扩散算法
AI绘画架构,核心算法就是运用了Diffusion(扩散算法)
举个列子:之前三亚出现游客聚集性新冠,如果当时不选择集中隔离,而是允许游客自由进出,那原本集中在一起的游客病例的特征(也可以说是病例轨迹),因为扩散开来,回到各个城市,那不同的游客的病例特征(病例轨迹)也会因此多样化了。
回到图像中,游客的病例特征也就是对应到图像的特征上(最直接的特征就是图像直方图)
对比以前的GAN也是图像生成的算法
GAN缺点:
- GAN训练两个网络,难度较大
- 不容易收敛,而且多样性比较差,只关注能骗过判别器
GAN所能生成出的图像,其图像特征多样性较差,在训练中,只需要生成器生成的图像能满足当前的判别器,使判别器不能识别出假的即可了。
2.Diffusion算法理论
Diffusion算法可以根据结构,有二个方向分成是前向过程和反向过程
2.1 前向过程
核心:不断对输入的图像数据加入噪声,最后变成一个纯噪声的数据
每个时刻 t tt,加入的噪声是不同的,并且加入噪声的数量,会随着时间,越来越多。
2.1.1 公式推导
2.2 后向过程(去噪过程)
2.2.1 公式推导
3.算法流程
模型的训练和预测,并通过损失函数来拟合,一直是围绕着噪声Z t 来求解的