CVPR 2024:生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

简介: 【4月更文挑战第14天】中山大学和微信团队的研究者提出 SingDiffusion,一种解决扩散模型在处理极端亮度图像时的平均亮度问题的新方法。SingDiffusion 可无缝集成到预训练模型中,无需额外训练,通过处理 t=1 时间步长的采样问题,改善了图像生成的亮度偏差。在 COCO 数据集上的实验显示,相较于现有模型,SingDiffusion 在 FID 和 CLIP 分数上表现更优。

91f6a35e6cc65a6444a0f35d3406f017.jpeg
在计算机视觉和图像生成领域,扩散模型因其卓越的性能而备受关注。然而,这些模型在处理极端亮度或暗度图像时常常遭遇挑战,导致生成的图像平均亮度问题。近期,来自中山大学和微信团队的研究者们提出了一种新颖的解决方案——SingDiffusion,有效解决了这一问题。

扩散模型通过学习从噪声到数据分布的逆过程来生成样本。尽管这些模型在多模态内容生成方面取得了显著成就,如图像、音频和视频生成,但其在时间区间端点的奇点处理上存在理论缺陷。特别是在t=0和t=1的时间点,模型的输出往往受限于高斯分布的假设,这在实际应用中导致了图像亮度的偏差。

微信视觉团队的研究者们首先从理论和实践两个角度对奇点问题进行了深入探讨。他们建立了逆过程近似的误差界限,并在理论上证明了在奇点时间步长处的高斯特性。基于这些理论洞见,研究者们确认了t=1处的奇点是可以条件移除的,而t=0处的奇点是扩散模型的固有属性。

为了解决初始奇点时间步长的采样问题,研究者们提出了SingDiffusion方法。这种方法可以无缝集成到现有的预训练模型中,无需额外的训练努力,有效解决了平均亮度问题,并显著提升了模型的生成能力。通过定量分析,SingDiffusion在生成极端亮度或暗度图像方面表现出色,特别是在生成纯白或纯黑背景的图像时,其性能提升尤为明显。

SingDiffusion的核心在于它能够处理t=1时的采样问题,这是大多数现有方法所忽略的。研究者们通过训练一个神经网络来估计初始时间步长的平均图像,从而确保生成的图像符合预期的亮度分布。此外,SingDiffusion还引入了一种规范化方法来处理引导尺度,这在初始奇点时间步长的应用中尤为重要。

在实验部分,研究者们在多个数据集上验证了SingDiffusion的有效性。他们在COCO数据集上使用FID(Fréchet Inception Distance)和CLIP分数来评估生成图像的质量。结果显示,与现有的稳定扩散模型相比,SingDiffusion在这两个指标上都有显著提升。此外,SingDiffusion还能够在不同的引导尺度下保持较低的FID分数,同时实现更高的CLIP分数,表明其在图像真实性和与输入提示的匹配度方面都有优势。

总微信视觉团队的研究者们通过SingDiffusion方法,为解决扩散模型中的奇点问题提供了一种有效的解决方案。然而,尽管SingDiffusion在处理极端亮度图像方面取得了显著进展,但在处理其他类型的奇点问题,如t=0时的采样问题,仍需要进一步的研究和改进。此外,SingDiffusion方法的通用性和在不同模型上的适应性也是未来研究的重要方向。

论文地址:https://arxiv.org/pdf/2403.08381.pdf

目录
相关文章
|
6月前
|
机器学习/深度学习 小程序 前端开发
微信小程序——实现对话模式(调用大模型图片生成)
微信小程序——实现对话模式(调用大模型图片生成)
373 3
|
6月前
【微信公众平台对接】有关【上传图文消息内的图片获取URL】调用示例
【微信公众平台对接】有关【上传图文消息内的图片获取URL】调用示例
154 0
|
22天前
|
小程序 JavaScript API
微信小程序开发之:保存图片到手机,使用uni-app 开发小程序;还有微信原生保存图片到手机
这篇文章介绍了如何在uni-app和微信小程序中实现将图片保存到用户手机相册的功能。
355 0
微信小程序开发之:保存图片到手机,使用uni-app 开发小程序;还有微信原生保存图片到手机
|
4月前
|
小程序 开发者
【微信小程序-原生开发】实用教程05-首页(含自定义调试模式、插入图片、图文排版、底部留白、添加本地图片)
【微信小程序-原生开发】实用教程05-首页(含自定义调试模式、插入图片、图文排版、底部留白、添加本地图片)
52 0
|
22天前
|
算法 小程序 Java
java制作海报三:获取微信二维码详情,并改变大小,合成到海报(另一张图片)上
这篇文章介绍了如何使用Java获取微信小程序的二维码,并将其调整大小后合成到海报(另一张图片)上。
36 0
|
3月前
|
小程序 前端开发
|
4月前
|
小程序 前端开发
【非常全】微信小程序下载图片到相册,微信小程序自动获取分享图片到相册
【非常全】微信小程序下载图片到相册,微信小程序自动获取分享图片到相册
209 3
|
4月前
|
前端开发 小程序
【微信小程序-原生开发】实用教程20 - 生成海报(实战范例为生成活动海报,内含生成指定页面的小程序二维码,保存图片到手机,canvas 系列教程)
【微信小程序-原生开发】实用教程20 - 生成海报(实战范例为生成活动海报,内含生成指定页面的小程序二维码,保存图片到手机,canvas 系列教程)
405 0
|
4月前
|
小程序 JavaScript 前端开发
【微信小程序-原生开发】实用教程06-轮播图、分类页签 tab 、成员列表(含Tdesign升级,切换调试基础库,设置全局样式,配置组件按需注入,添加图片素材,wx:for,生命周期 onLoad)
【微信小程序-原生开发】实用教程06-轮播图、分类页签 tab 、成员列表(含Tdesign升级,切换调试基础库,设置全局样式,配置组件按需注入,添加图片素材,wx:for,生命周期 onLoad)
125 0
|
5月前
|
小程序 API
技术心得记录:微信小程序之图片频繁变化,几秒之后输出结果(适用于抽奖)
技术心得记录:微信小程序之图片频繁变化,几秒之后输出结果(适用于抽奖)
26 0