Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了(2)

简介: Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了

编码模型


图 6 显示了编码模型对与 LDM 相关的三种潜像的预测精度:z,原始图像的潜像;c,图像文本注释的潜像;以及 z_c,经过与 c 交叉注意力反向扩散过程后的 z 的加噪潜像表征。


图 7 显示,当加入少量的噪声时,z 对整个皮层的体素活动的预测比 z_c 更好。有趣的是,当增加噪声水平时,z_c 对高位视觉皮层内体素活动的预测优于 z,表明图像的语义内容逐渐被强调。



在迭代去噪过程中,添加噪声的潜在表征如何变化?图 8 显示,在去噪过程的早期阶段,z 信号主导了 fMRI 信号的预测。在去噪过程的中间阶段,z_c 对高位视觉皮层内活动的预测比 z 好得多,表明大部分语义内容在这个阶段出现了。结果显示了 LDM 如何从噪声中提炼和生成图像。


最后,研究者探讨了 U-Net 的每一层都在处理什么信息。图 9 显示了去噪过程的不同步骤(早期、中期、晚期)以及 U-Net 不同层的编码模型的结果。在去噪过程的早期阶段,U-Net 的瓶颈层(橙色)在整个皮层中产生了最高的预测性能。然而,随着去噪的进行,U-Net 的早期层(蓝色)预测早期视觉皮层内的活动,而瓶颈层则转向对更高的视觉皮层的卓越预测能力。


更多研究细节,可查看原论文。

相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
[大语言模型-论文精读] Diffusion Model技术-通过时间和空间组合扩散模型生成复杂的3D人物动作
[大语言模型-论文精读] Diffusion Model技术-通过时间和空间组合扩散模型生成复杂的3D人物动作
33 0
|
3月前
|
人工智能 安全 测试技术
ECCV 2024:机器遗忘之后,扩散模型真正安全了吗?
【9月更文挑战第22天】在人工智能技术飞速发展的背景下,扩散模型(DMs)在图像生成领域取得了显著突破,但同时也带来了潜在的安全风险。为此,研究人员提出了一种基于安全性的机器遗忘技术,旨在让模型忘记有害概念。然而,其有效性仍存疑。近期,一篇发表在ECCV 2024的论文提出了一种新的评估框架,利用对抗性提示测试经过机器遗忘处理的扩散模型的鲁棒性。研究人员开发了名为UnlearnDiffAtk的高效对抗性提示生成方法,简化了生成过程,无需额外分类器。广泛的基准测试显示,UnlearnDiffAtk在效果和效率上均优于现有方法,但也揭示了现有机器遗忘技术在鲁棒性上的不足。
84 5
|
3月前
|
机器学习/深度学习 数据采集
详解Diffusion扩散模型:理论、架构与实现
【9月更文挑战第23天】扩散模型(Diffusion Models)是一类基于随机过程的深度学习模型,通过逐步加噪和去噪实现图像生成,在此领域表现优异。模型分正向扩散和反向生成两阶段:前者从真实数据加入噪声至完全噪音,后者则学习从噪声中恢复数据,经由反向过程逐步还原生成清晰图像。其主要架构采用U-net神经网络,实现过程中需数据预处理及高斯噪声添加等步骤,最终通过模型逆向扩散生成新数据,具有广泛应用前景。
126 0
|
7月前
|
人工智能 计算机视觉
让机器准确看懂手物交互动作,清华大学等提出GeneOH Diffusion方法
【5月更文挑战第19天】清华大学等机构的研究人员提出GeneOH Diffusion方法,以提升机器对手物体交互动作的理解。该方法使用去噪扩散模型学习动作的潜在分布,能处理复杂场景并泛化到新动作,增强模型的通用性和适应性。尽管需要大量数据和计算资源训练,且可能在复杂动作识别上存在局限,但其强大的泛化能力对实际应用具有重要意义。[链接](https://arxiv.org/abs/2402.14810)
79 7
|
数据采集 人工智能 数据可视化
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像
196 0
|
机器学习/深度学习 人工智能 计算机视觉
Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了(1)
Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了
|
机器学习/深度学习 人工智能 编解码
TPAMI 2023 | 无创解码大脑信号语义,中科院自动化所研发脑-图-文多模态学习模型
TPAMI 2023 | 无创解码大脑信号语义,中科院自动化所研发脑-图-文多模态学习模型
136 0
|
存储 机器学习/深度学习 人工智能
YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型!!!
YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型!!!
402 0
|
机器学习/深度学习 人工智能 编解码
图像生成终结扩散模型,OpenAI「一致性模型」加冕!GAN的速度一步生图,高达18FPS(1)
图像生成终结扩散模型,OpenAI「一致性模型」加冕!GAN的速度一步生图,高达18FPS
186 0
|
机器学习/深度学习 Web App开发 人工智能
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像(2)
AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像
197 0