Diffusion Model算法

简介: Diffusion Model算法

导语


最近AI绘画应用如火如荼,

有关算法的应用产品也很多,比如DALLE2

官网地址:https://openai.com/dall-e-2/

DALLE2产品描述:DALL·E2是一个新的人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术

其主要功能有:

DALLE 2可以从文本描述中创建原创、逼真的图像和艺术。它可以组合概念、属性和样式。

DALLE 2可以通过自然语言字幕对现有图像进行逼真的编辑。它可以添加和删除元素,同时考虑阴影、反射和纹理。

6331715ff6ae4bdc856cfbe838237b85.png

DALLE 2可以将图像扩展到原始画布之外,创造出更广阔的新构图

DALLE 2可以创建不同的灵感来源于原作。

089a1c21237242c282f612d34167bbdc.png

1.为什么叫扩散算法


AI绘画架构,核心算法就是运用了Diffusion(扩散算法)


举个列子:之前三亚出现游客聚集性新冠,如果当时不选择集中隔离,而是允许游客自由进出,那原本集中在一起的游客病例的特征(也可以说是病例轨迹),因为扩散开来,回到各个城市,那不同的游客的病例特征(病例轨迹)也会因此多样化了。


回到图像中,游客的病例特征也就是对应到图像的特征上(最直接的特征就是图像直方图)

对比以前的GAN也是图像生成的算法

GAN缺点:


  • GAN训练两个网络,难度较大
  • 不容易收敛,而且多样性比较差,只关注能骗过判别器

GAN所能生成出的图像,其图像特征多样性较差,在训练中,只需要生成器生成的图像能满足当前的判别器,使判别器不能识别出假的即可了。


2.Diffusion算法理论


Diffusion算法可以根据结构,有二个方向分成是前向过程和反向过程


2.1 前向过程


核心:不断对输入的图像数据加入噪声,最后变成一个纯噪声的数据


1687269319056.png


74b4901719a44c839da77fac09d37f90.png

每个时刻 t tt,加入的噪声是不同的,并且加入噪声的数量,会随着时间,越来越多。


2.1.1 公式推导

1687269383565.png

1687269403394.png

 


2.2 后向过程(去噪过程)


1687269435483.png


2.2.1 公式推导


1687269494920.png

1687269514213.png


3.算法流程


模型的训练和预测,并通过损失函数来拟合,一直是围绕着噪声Z t 来求解的


1687269566318.png


相关文章
|
4月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】Fearnet Brain-inspired model for incremental learning
本文介绍了FearNet,一种受大脑记忆机制启发的神经网络模型,用于解决增量学习中的灾难性遗忘问题。FearNet不存储先前的例子,而是使用由海马体复合体和内侧前额叶皮层启发的双记忆系统,以及一个受基底外侧杏仁核启发的模块来决定使用哪个记忆系统进行回忆,有效减轻了灾难性遗忘,且在多个数据集上取得了优异的性能。
35 6
|
4月前
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】A biologically inspired dual-network memory model for reduction of catastrophic
本文介绍了一种受生物学启发的双网络记忆模型,由海马网络和新皮层网络组成,通过模拟海马CA3区的混沌行为和齿状回区的神经元更替,以及新皮层网络中的伪模式学习,有效减少了神经网络在学习新任务时的灾难性遗忘问题。
35 4
|
7月前
|
资源调度 算法 数据挖掘
R语言有限混合模型(FMM,finite mixture model)EM算法聚类分析间歇泉喷发时间
R语言有限混合模型(FMM,finite mixture model)EM算法聚类分析间歇泉喷发时间
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP 2023】面向Stable Diffusion的自动Prompt工程算法BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulPrompt通过对低质量和高质量的提示进行微调,并进一步提出了一种基于强化学习和视觉信号反馈的技术,以最大化生成提示的奖励值
|
机器学习/深度学习 人工智能 算法
Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法(2)
Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法
623 0
|
机器学习/深度学习 人工智能 算法
Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法(1)
Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法
529 0
|
机器学习/深度学习 数据可视化 算法
机器学习算法之——决策树模型(Decision Tree Model)
简单说明一下上面的图像, 每一个叶子节点中有class, 表示按照上面的规则, 会被分到哪一个类别中. 同时, 每一个节点中有values, 表示到这一个节点中每一个类别的样本有多少个, 如上面的例子中一共有3类样本, 所以values中有三个数字, 分别是三个类别的样本的个数.
机器学习算法之——决策树模型(Decision Tree Model)
ML之GMM:Gaussian Mixture Model高斯混合模型相关论文、算法步骤相关配图
ML之GMM:Gaussian Mixture Model高斯混合模型相关论文、算法步骤相关配图
ML之GMM:Gaussian Mixture Model高斯混合模型相关论文、算法步骤相关配图
|
16天前
|
算法
基于WOA算法的SVDD参数寻优matlab仿真
该程序利用鲸鱼优化算法(WOA)对支持向量数据描述(SVDD)模型的参数进行优化,以提高数据分类的准确性。通过MATLAB2022A实现,展示了不同信噪比(SNR)下模型的分类误差。WOA通过模拟鲸鱼捕食行为,动态调整SVDD参数,如惩罚因子C和核函数参数γ,以寻找最优参数组合,增强模型的鲁棒性和泛化能力。
|
2天前
|
供应链 算法 调度
排队算法的matlab仿真,带GUI界面
该程序使用MATLAB 2022A版本实现排队算法的仿真,并带有GUI界面。程序支持单队列单服务台、单队列多服务台和多队列多服务台三种排队方式。核心函数`func_mms2`通过模拟到达时间和服务时间,计算阻塞率和利用率。排队论研究系统中顾客和服务台的交互行为,广泛应用于通信网络、生产调度和服务行业等领域,旨在优化系统性能,减少等待时间,提高资源利用率。
下一篇
DataWorks