Diffusion Model算法

简介: Diffusion Model算法

导语


最近AI绘画应用如火如荼,

有关算法的应用产品也很多,比如DALLE2

官网地址:https://openai.com/dall-e-2/

DALLE2产品描述:DALL·E2是一个新的人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术

其主要功能有:

DALLE 2可以从文本描述中创建原创、逼真的图像和艺术。它可以组合概念、属性和样式。

DALLE 2可以通过自然语言字幕对现有图像进行逼真的编辑。它可以添加和删除元素,同时考虑阴影、反射和纹理。

6331715ff6ae4bdc856cfbe838237b85.png

DALLE 2可以将图像扩展到原始画布之外,创造出更广阔的新构图

DALLE 2可以创建不同的灵感来源于原作。

089a1c21237242c282f612d34167bbdc.png

1.为什么叫扩散算法


AI绘画架构,核心算法就是运用了Diffusion(扩散算法)


举个列子:之前三亚出现游客聚集性新冠,如果当时不选择集中隔离,而是允许游客自由进出,那原本集中在一起的游客病例的特征(也可以说是病例轨迹),因为扩散开来,回到各个城市,那不同的游客的病例特征(病例轨迹)也会因此多样化了。


回到图像中,游客的病例特征也就是对应到图像的特征上(最直接的特征就是图像直方图)

对比以前的GAN也是图像生成的算法

GAN缺点:


  • GAN训练两个网络,难度较大
  • 不容易收敛,而且多样性比较差,只关注能骗过判别器

GAN所能生成出的图像,其图像特征多样性较差,在训练中,只需要生成器生成的图像能满足当前的判别器,使判别器不能识别出假的即可了。


2.Diffusion算法理论


Diffusion算法可以根据结构,有二个方向分成是前向过程和反向过程


2.1 前向过程


核心:不断对输入的图像数据加入噪声,最后变成一个纯噪声的数据


1687269319056.png


74b4901719a44c839da77fac09d37f90.png

每个时刻 t tt,加入的噪声是不同的,并且加入噪声的数量,会随着时间,越来越多。


2.1.1 公式推导

1687269383565.png

1687269403394.png

 


2.2 后向过程(去噪过程)


1687269435483.png


2.2.1 公式推导


1687269494920.png

1687269514213.png


3.算法流程


模型的训练和预测,并通过损失函数来拟合,一直是围绕着噪声Z t 来求解的


1687269566318.png


目录
打赏
0
0
1
0
31
分享
相关文章
【博士每天一篇文献-算法】Fearnet Brain-inspired model for incremental learning
本文介绍了FearNet,一种受大脑记忆机制启发的神经网络模型,用于解决增量学习中的灾难性遗忘问题。FearNet不存储先前的例子,而是使用由海马体复合体和内侧前额叶皮层启发的双记忆系统,以及一个受基底外侧杏仁核启发的模块来决定使用哪个记忆系统进行回忆,有效减轻了灾难性遗忘,且在多个数据集上取得了优异的性能。
56 6
【博士每天一篇文献-算法】A biologically inspired dual-network memory model for reduction of catastrophic
本文介绍了一种受生物学启发的双网络记忆模型,由海马网络和新皮层网络组成,通过模拟海马CA3区的混沌行为和齿状回区的神经元更替,以及新皮层网络中的伪模式学习,有效减少了神经网络在学习新任务时的灾难性遗忘问题。
51 4
R语言有限混合模型(FMM,finite mixture model)EM算法聚类分析间歇泉喷发时间
R语言有限混合模型(FMM,finite mixture model)EM算法聚类分析间歇泉喷发时间
【EMNLP 2023】面向Stable Diffusion的自动Prompt工程算法BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulPrompt通过对低质量和高质量的提示进行微调,并进一步提出了一种基于强化学习和视觉信号反馈的技术,以最大化生成提示的奖励值
机器学习算法之——决策树模型(Decision Tree Model)
简单说明一下上面的图像, 每一个叶子节点中有class, 表示按照上面的规则, 会被分到哪一个类别中. 同时, 每一个节点中有values, 表示到这一个节点中每一个类别的样本有多少个, 如上面的例子中一共有3类样本, 所以values中有三个数字, 分别是三个类别的样本的个数.
机器学习算法之——决策树模型(Decision Tree Model)
ML之GMM:Gaussian Mixture Model高斯混合模型相关论文、算法步骤相关配图
ML之GMM:Gaussian Mixture Model高斯混合模型相关论文、算法步骤相关配图
ML之GMM:Gaussian Mixture Model高斯混合模型相关论文、算法步骤相关配图
基于FPGA的图像双线性插值算法verilog实现,包括tb测试文件和MATLAB辅助验证
本项目展示了256×256图像通过双线性插值放大至512×512的效果,无水印展示。使用Matlab 2022a和Vivado 2019.2开发,提供完整代码及详细中文注释、操作视频。核心程序实现图像缩放,并在Matlab中验证效果。双线性插值算法通过FPGA高效实现图像缩放,确保质量。
基于遗传优化算法的风力机位置布局matlab仿真
本项目基于遗传优化算法(GA)进行风力机位置布局的MATLAB仿真,旨在最大化风场发电效率。使用MATLAB2022A版本运行,核心代码通过迭代选择、交叉、变异等操作优化风力机布局。输出包括优化收敛曲线和最佳布局图。遗传算法模拟生物进化机制,通过初始化、选择、交叉、变异和精英保留等步骤,在复杂约束条件下找到最优布局方案,提升风场整体能源产出效率。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等