理论到应用,朱军教授带团队解读扩散概率模型

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 理论到应用,朱军教授带团队解读扩散概率模型


2022 年以来,扩散模型成为计算机视觉领域最热门的话题之一。扩散模型在深度生成模型中自成一派,展示出强大的生成能力,无论是生成高水平的细节还是其生成的多样性,都让人印象深刻。


迄今为止,扩散模型已被应用于各种生成式建模任务,如图像生成、图像超分、图像修复、图像编辑、图像转换等等。可以看到,这一方向的论文数量正在以非常快的速度增长,而扩散概率模型正是其中一个重要的类别。

在最新一期的线上分享中,机器之心邀请到了清华大学计算机系教授朱军为我们介绍关于扩散概率模型的最新进展。


分享主题:扩散概率模型的理论及应用

分享摘要:本次分享中将介绍朱军教授团队关于扩散概率模型的最新进展。首先,将简要介绍深度生成模型的基本原理和典型进展。然后,介绍扩散概率模型的两个代表性进展:第一个工作是《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》。该工作给出了扩散概率模型逆向过程最优均值和最优方差的解析解。该解析解表明了一个令人惊讶的结论是,最优均值和最优方差均由得分函数决定。因此,一个预训练好的得分模型便可同时估计最优均值和最优方差。此外,根据该解析解的形式,我们能界定出最优方差的上下界,并且在数值上表明该上下界是紧的。在实际中,通过估计最优的方差,我们能提升模型在密度估计上的性能,以及显著提升模型的采样速度。第二个工作是《DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps》。该工作从数学上推导出了扩散常微分方程模型(diffusion ODEs)的极其简洁的解的形式,并基于该形式设计了误差尽可能最小的高阶常微分方程求解器,称为 DPM-Solver。DPM-Solver 无需任何额外训练,并同时适用于连续时间情形与离散时间情形的扩散模型。实验结果表明,DPM-Solver 可在 20 步左右达到几乎收敛的采样,甚至在 10 步左右也可以生成较高质量的图片,在不同分辨率的数据集中都取得了显著优于所有已有算法的加速效果。嘉宾简介:朱军,清华大学计算机系 Bosch AI 教授、人智所所长,瑞莱智慧联合创始人兼首席科学家,曾任卡内基梅隆大学兼职教授。长期从事机器学习研究,特别是概率机器学习、贝叶斯方法的基础理论、高效算法和编程库,并利用贝叶斯方法研究深度神经网络的对抗鲁棒性以及复杂环境下的决策学习等问题。担任 IEEE TPAMI 的副主编,ICML、NeurIPS、ICLR 等国际会议资深领域主席 / 领域主席 20 余次。曾获科学探索奖、中国计算机学会自然科学一等奖、吴文俊人工智能自然科学一等奖、ICLR 杰出论文奖等,入选万人计划领军人才、MIT TR35 中国先锋者、IEEE“AI’s 10 to Watch”、北京市优秀青年人才等,带领团队研制 “珠算” 深度概率编程库、“天授”强化学习库和 Ares 对抗攻防平台。获首届 “对抗样本攻防竞赛” 国际竞赛所有三个任务的冠军、ViZDoom 对抗决策国际竞赛 2018 年冠军等。鲍凡同学在扩散概率模型上做出了突出成果,他作为一作的论文《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》获得世界级学术奖项 ICLR 2022 杰出论文奖,是该会议首篇且唯一一篇由中国大陆单位独立完成的获奖论文。该项目产生了广泛的影响力,作为核心技术被应用到 OpenAI 发布的超大规模跨模态生成模型 DALL·E 2 上。他积极探索扩散概率模型的应用场景,在扩散模型的加速、可控生成、基本架构方面产出近十篇论文,在理论研究及实践应用上均有出色的成果贡献。路橙同学致力于研究扩散概率模型的底层原理与算法,他作为一作的论文《DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps》获得 Neurips 2022 Oral(接受率约 1.7%),是目前扩散模型无需额外训练的最快的采样算法,可在 20 步左右达到几乎收敛的采样,甚至在 10 步左右也可以生成较高质量的图片。该项目在各大开源社区产生了广泛的影响,目前项目 Github 获得 300+ star,并已被扩散模型主流库 Diffusers 支持。该算法在 Stable-Diffusion 上仅仅使用 20-25 步就可生成极高质量的图片,是目前 Stable-Diffusion 在 huggingface spaces 的官方示例的默认采样算法,在 DreamStudio、StableBoost、Stable-Diffusion-WebUI 等各大 text-to-image 项目中也为公认的加速效果最好的算法。此外,他积极探索扩散概率模型的底层原理,在扩散常微分方程模型的最大似然训练算法、高阶去噪得分匹配算法等方面做出了重要的理论贡献。

相关文章
|
2月前
|
机器学习/深度学习 数据可视化
KAN干翻MLP,开创神经网络新范式!一个数十年前数学定理,竟被MIT华人学者复活了
【10月更文挑战第12天】MIT华人学者提出了一种基于Kolmogorov-Arnold表示定理的新型神经网络——KAN。与传统MLP不同,KAN将可学习的激活函数放在权重上,使其在表达能力、准确性、可解释性和收敛速度方面表现出显著优势,尤其在处理高维数据时效果更佳。然而,KAN的复杂性也可能带来部署和维护的挑战。论文地址:https://arxiv.org/pdf/2404.19756
46 1
|
7月前
|
人工智能 UED
清华大学研究提出用大模型做心理测量
【2月更文挑战第24天】清华大学研究提出用大模型做心理测量
270 2
清华大学研究提出用大模型做心理测量
|
机器学习/深度学习 人工智能 API
一口气看完《哈利波特》:AI大模型「量子速读」,一分钟抵人类五小时
一口气看完《哈利波特》:AI大模型「量子速读」,一分钟抵人类五小时
231 0
一口气看完《哈利波特》:AI大模型「量子速读」,一分钟抵人类五小时
|
机器学习/深度学习 人工智能 编解码
理论到应用,朱军教授带团队解读扩散概率模型
理论到应用,朱军教授带团队解读扩散概率模型
316 0
|
机器学习/深度学习 自然语言处理 算法
「扩散模型」首篇综述!谷歌&北大最新研究
「扩散模型」首篇综述!谷歌&北大最新研究
565 0
|
数据安全/隐私保护
把「醉汉游走」引入「三体问题」,以色列学者新思路登上物理学顶刊
把「醉汉游走」引入「三体问题」,以色列学者新思路登上物理学顶刊
199 0
把「醉汉游走」引入「三体问题」,以色列学者新思路登上物理学顶刊
|
机器学习/深度学习 传感器 人工智能
Reddit热议:15岁高中生用神经网络建立生命进化“新宇宙”
一位年仅15岁波兰高中生利用神经网络和遗传算法模拟出了人造生命的繁衍和进食活动,将视频发在了Youtube上。reddit网友纷纷表示鼓励,并表示,过个几百万年,说不定这个网络能够进化出战争和国家!
193 0
Reddit热议:15岁高中生用神经网络建立生命进化“新宇宙”
|
机器学习/深度学习 JavaScript 算法
视频 | NeurIPS 2019分享:清华大学孙富春组提出全新模仿学习理论
在 NeurIPS 2019正式召开以前,机器之心精心策划了 NeurIPS 2019 专题,包括线上分享、论文解读、现场报道等内容。11月14日,第一期分享已经圆满结束。本文介绍的是「全新智能体观测模仿学习」,这是清华计算机系类脑计算与认知团队最新提出的一种学习理论,也是学界首次将生成式对抗方法推广到观测模仿学习中。
259 0
视频 | NeurIPS 2019分享:清华大学孙富春组提出全新模仿学习理论
|
机器学习/深度学习 算法 数据可视化
NeurIPS 2019分享:清华大学孙富春组提出全新模仿学习理论
在 NeurIPS 2019正式召开以前,机器之心精心策划了 NeurIPS 2019 专题,包括线上分享、论文解读、现场报道等内容。11月14日,第一期分享已经圆满结束。本文介绍的是「全新智能体观测模仿学习」,这是清华计算机系类脑计算与认知团队最新提出的一种学习理论,也是学界首次将生成式对抗方法推广到观测模仿学习中。
578 0
 NeurIPS 2019分享:清华大学孙富春组提出全新模仿学习理论
|
机器学习/深度学习 人工智能 自然语言处理
解决自然语言歧义问题,斯坦福教授、IJCAI 卓越研究奖得主提出 SenseBERT 模型
自然语言理解和生成对于 AI 系统来说是一大难题,语言的复杂性和模糊性对 AI 系统提出了很大挑战。今天,斯坦福教授、IJCAI 卓越研究奖得主 Yoav Shoham 创办的公司 AI21 Labs 提出一种能够显著提升词汇消歧能力的新模型,并发布了可控性优于其他前沿文本生成系统的「HAIM」。AI21 Labs 的愿景是构建「具备前所未有的优秀自然语言理解和生成能力」的 AI 系统。
317 0
解决自然语言歧义问题,斯坦福教授、IJCAI 卓越研究奖得主提出 SenseBERT 模型

热门文章

最新文章

下一篇
无影云桌面