AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像

简介: AI读脑炸裂!扫描大脑画面,Stable Diffusion逼真复现图像




 新智元报道  

编辑:编辑部

【新智元导读】近日,一项研究声称能够用Stable Diffusion将大脑活动重建为高分辨率、高精确度的图像。相关论文被CVPR 2023接收,引起网友哗然,AI读脑已经近在咫尺?


即便没有霍格沃茨的魔法,也能看到别人在想什么了!方法很简单,基于Stable Diffusion便可视化大脑图像。比如,你看到的小熊、飞机、火车是这样的。当AI看到大脑信号后,生成的图像是下面的样子,可见该有的要点全有了。这个AI读脑术刚刚被CVPR 2023接收,让圈友们瞬间「颅内高潮」。太野了!忘了提示工程吧,现在你只需要用脑子去「想」那些画面就行了。想象一下,用Stable Diffusion从fMRI数据中重建视觉图像,或许意味着未来可能发展为非入侵式的脑机接口。让AI直接跳过人类语言,感知人类大脑中所思所想。到时候,马斯克搞的Neuralink也要追赶这一AI天花板了。

无需微调,用AI直接复现你在想什么


那么,AI读脑究竟如何实现?最新研究来自日本大阪大学的研究团队。

论文地址:https://sites.google.com/view/stablediffusion-with-brain/大阪大学前沿生物科学研究生院和日本NICT的CiNet的研究人员基于潜在的扩散模型(LDM),更具体地说,通过Stable Diffusion从fMRI数据中重建视觉体验。整个运作过程的框架也非常简单:1个图像编码器、1个图像解码器,还有1个语义解码器。通过这样做,该团队消除了训练和微调复杂人工智能模型的需要。所有需要训练的是简单的线性模型,将下部和上部视觉脑区的fMRI信号映射到单个Stable Diffusion成分。具体来说,研究人员将大脑区域映射为图像和文本编码器的输入。下部脑区被映射到图像编码器,上部脑区被映射到文本编码器。如此一来可以这让该系统能够使用图像组成和语义内容进行重建。首先是解码分析。研究中采用的LDM模型,由图像编码器ε、图像解码器D、文本编码器τ组成。研究者分别从早期和高级视觉皮层的fMRI信号中解码出重建图像z以及相关文本c的潜在表征,将其作为输入,由自动编码器生成复现出的图像Xzc。接着,研究者还建立了一个编码模型,对来自LDM不同组件的fMRI信号进行预测,从而探索LDM的内部运作机制。研究人员使用来自自然场景数据集(NSD)的fMRI图像进行实验,并测试他们是否能使用Stable Diffusion来重建受试者看到的东西。可以看到,编码模型与LDM相关潜像预测精度,最后一种模型在大脑后部视觉皮层产生的预测精确度是最高的。对一个主体的视觉重建结果显示,只用z重建的图像在视觉上与原始图像一致,但不能捕捉到语义内容。而只用c重建的图像具有较好的语义保真度,但视觉一致性较差,使用zc重建的图像则可以同时具备高语义保真度和高分辨率。来自所有受试者对同一图像的重建结果显示,重建的效果在不同受试者之间是稳定且比较准确的。而在具体细节方面的差异,可能来源于不同个体感知经验或者数据质量的不同,而非是重建过程有误。最后,定量评估的结果被绘制成图表。种种结果显示,研究中采用的方法不仅可以捕捉到低层次的视觉外观,而且还能捕捉到原始刺激物的高层次语义内容。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI进化论:从识别模式到创造世界的“数字大脑”
AI进化论:从识别模式到创造世界的“数字大脑”
127 63
|
3月前
|
存储 机器学习/深度学习 人工智能
告别信息焦虑,用这个国产AI工具做知识管理,大脑终于解放了
文章介绍了纳米AI知识库作为“第二大脑”的强大功能。它能高效管理海量信息,支持54种文件格式上传,自动提取关键数据并打标签,轻松整合工作与生活中的碎片化信息。通过场景测试显示,在工作和生活中,纳米AI可快速生成报告、提供精准数据,极大提升效率。其共享机制还促进了团队协作,释放了创造力,让用户从琐碎事务中解脱,专注于深度思考与创新。
|
1月前
|
人工智能 IDE 开发工具
2.4k star 开源项目,Wingman AI + 知识图谱,如何帮你搭建‘私人大脑’?学术/项目必备,让笔记真正活起来!
MindForger 是一款灵感源于人脑思维机制的桌面 Markdown IDE,帮助用户构建私人知识体系。它通过强大的语义联想与结构重构功能,解决笔记混乱、缺乏智能联接等痛点。核心功能包括 TAYR/TAYW 联想、知识图谱浏览器、Markdown 编辑器和 AI 助手 Wingman。支持本地隐私保护,跨平台使用,开源 GPLv2 许可。项目地址:https://github.com/dvorka/mindforger。
|
15天前
|
人工智能 运维 自然语言处理
电力+AI,「国网云智」重构电网运维的"超级大脑"
在深夜,当城市楼宇渐入梦乡时,在国网信通公司云运营中心还有一批运维工程师默默守护着大家微弱的灯光、此起彼伏的沟通声、咔咔的键盘敲击声响彻着每个工位。 当某系统的异常警报亮起时,工程师迅速利用「国网云智」定位问题,屏幕上即刻弹出详尽的排查方案及解决方案;而另一侧的监控员框选闪烁的告警区域,系统已自动锁定故障点,并在生成检修方案上标注了对应的工具清单和操作优先级。
|
2天前
|
人工智能 PyTorch 区块链
当AI遇上区块链,会不会搞出一个“去中心化大脑”?
当AI遇上区块链,会不会搞出一个“去中心化大脑”?
33 9
|
4月前
|
机器学习/深度学习 人工智能 算法
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频,支持自定义相机轨迹和多种动态路径,生成高质量且时间平滑的视频。
198 0
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
|
14天前
|
存储 网络协议 人工智能
我在网上看到了一篇关于将智能AI、脑机接口接入到大脑的文章之后大发灵感,我现在写写我自己的版本
本项目设想一种脑机接口系统,结合阿里云操作系统与量子意识技术,实现用户通过心灵感应与AI交互、下载知识、远程医疗等操作。系统分为侵入式与非侵入式设备,支持意识上网、意念输入、跨物种通讯等功能,并构建“全宇宙意识互联网”架构,实现与传统网络的数据互通,探索未来人机交互与通信新形态。
|
4月前
|
机器学习/深度学习 人工智能 安全
Stable Diffusion 3.0 :一键开启你的AI绘画之旅
本文介绍了Stable Diffusion 3.0的主要优化,包括采用DiT架构提升多对象生成能力及“流匹配”技术加速采样。同时解决了部署复杂、显卡需求高等问题,可通过阿里云计算巢一键部署,实现即开即用。文章展示了人像、动漫风、科幻风等生成效果,并提供中文菜单设置与插件下载教程。无论是专业设计师还是普通用户,都能轻松开启智能创作新时代。 Flux模型支持即将上线,值得期待。
|
3月前
|
人工智能 JavaScript 搜索推荐
AI天马行空,FIM创新落地!创新大师软件让大脑走进"创新健身房"
AI虽强大,但存在同质化、文化单一及多样性下降等问题,难以真正驱动创新。而FIM(创新大师)软件基于TRIZ理论,如同“创新健身房”,通过系统化的工具和方法锻炼用户的创新思维。它引导用户识别矛盾、拓展跨领域思路、实现差异化创新,有效弥补AI短板。FIM不仅是解决问题的工具,更是培养创新人才的摇篮,帮助企业缩短研发周期、提升市场竞争力。结合AI的广度与FIM的深度,才能真正实现创新落地。
|
4月前
|
域名解析 人工智能 API
使用 Websoft9 面板部署 LobeChat,打造个人 AI 大脑
本书详细介绍了从服务器环境准备到LobeChat部署与维护的全过程。首先,指导用户选购云服务器并配置安全组和SSH登录;接着,通过Websoft9面板一键安装并初始化,支持域名解析。随后,重点讲解了LobeChat的部署方法,包括应用市场和手动部署,并深入探讨多模型接入及插件扩展。最后,提供了日常维护命令和常见问题解决方法,确保系统稳定运行。适合新手及进阶用户参考。
144 0

热门文章

最新文章