整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊

简介: 整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
12  月 15 日,Nature 子刊《自然 - 机器智能》发表了由华中科技大学人工智能学院发起、剑桥大学、斯坦福大学、约翰霍普金斯大学、MD  安德森肿瘤医院、华中科技大学同济医学院附属同济医院、附属协和医院、国家药物筛选中心等国内外权威科研机构联合开发的联邦学习开源医学人工智能(AI)计算框架(Unified  CT AI Diagnostic Initiative , UCADI)。

人工智能技术正在变革传统医疗。但当前人工智能模型普遍泛化性差:模型在训练过的数据集上表现优异,但是对于未曾见过的数据,表现差别大。这个根本性的缺陷导致  AI  技术在医学、医疗应用中表现出的局限性,甚至安全问题更加突出。由于医疗数据受到个人隐私,知识产权,数据尺寸等多方面的限制,无法实现大范围、集中式的数据融合,当前医学人工智能模型通常只能在有限,甚至单一的数据集上训练。因此在这样条件下构建的医疗  AI 模型应用范围十分有限。
为了解决这个根本性问题,华中科技大学人工智能学院夏天教授与白翔教授团队提出基于联邦学习(Federated learning)开源医学人工智能计算框架(UCADI),并发表在了《自然 - 机器智能》上

image.png

论文地址:https://www.nature.com/articles/s42256-021-00421-z

此架构在保证数据安全与隐私前提下,无需传输数据,能在不同物理地点共享训练医学数据,构建泛化性强的医学 AI 模型。

不仅如此,基于   UCADI,夏天教授与白翔教授联合华中科技大学同济医学院附属同济医院、附属协和医院、武汉天佑医院、武汉中心医院、武汉儿童医院、国家药物筛选中心与英国剑桥大学医学中心(维护全欧盟新冠影像数据,包括全英  23 家医院)发起国际大合作,实现真正全球分布式共享新冠影像数据 AI 模型训练与构建。

image.png

基于中英 23 家医院近万张的胸部 CT 扫描数据,研究团队验证了  UCADI 能够在保证用户数据隐私的情况下,多快好省地进行人工智能辅助诊断模型的训练和推理,实现跨国多中心的新冠病毒智能诊断。基于 UCADI  训练的 AI  新冠诊断模型相对于单个医院数据训练出的模型,不仅对新冠辅助诊断性能远超,同时在多个不同医院的验证数据集上表现出良好的泛化性与鲁棒性。

团队还进一步分析了模型的可解释性和不确定性,并验证了训练的 AI 模型能够捕捉到类似磨玻璃样阴影、小叶间隔增厚等新冠病人独有的 CT 特征。在此基础上,团队成员研究了数据异质性对模型性能的影响。

剑桥大学博士生、文章的共同一作王瀚宸发现“除了不同的医生、医院在  CT 的采集步骤上有所不同,国家与国家之间的差异更大。中英两国的 CT 数据有一个很大的区别是,中国的数据都是平扫,而英国的 CT  有很大一部分是注入造影剂后进行的增强扫描。此外,两国病人在年龄等属性上的分布也很不同,英国患者中的老年人比例非常高。这种数据上的异质性,对模型的训练是个很大的挑战。

image.png

为了应对这种数据异质性,团队首先进行了很多模型上的筛选和尝试,在几种常见的 3D 卷积网络架构中,最后选择 3D DenseNet。不仅是因为其较好的泛化性能,同时模型尺寸偏小,非常方便联邦学习中进行传输。但值得注意的是,3D  DenseNet 也需要更多的计算资源。在此基础上,团队还尝试用 CycleGAN 在增强和平扫的 CT  间进行转换,取得了一些性能上的改善,但还是有相当的可提升空间。

image.png

此工作中,UCADI  框架初步展示了对于全球新冠数据的整合能力,基于全球范围数据构建的新冠诊断预测模型完全向全球开放使用,各国医疗机构可以在此基础上,利用  UCADI 进一步共享、更新、演进、优化预测模型。同时,UCADI  框架完全开源,可用于其他类型医疗数据,为未来的跨国智能诊断系统的研究与发展提供了基础设施。

团队已与剑桥大学和世界卫生组织  10 月份在德国新设立的疫情智能防控中心 (WHO Hub for Pandemic and Epidemic Intelligence)  建立进一步合作,重点研究现有的 AI 诊疗模型对识别新变种 Omicron 的鲁棒性,以及探索用持续学习 (Continual  Learning) 等方法来开发一个可不断进化的联邦学习诊疗框架。

目录
打赏
0
0
0
0
1031
分享
相关文章
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
ChildMandarin是由智源研究院与南开大学联合推出的开源语音数据集,包含41.25小时3-5岁儿童普通话语音数据,覆盖中国22个省级行政区,为儿童语音识别和语言发展研究提供高质量数据支持。
92 20
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
让AI绘画进入「指哪画哪」的精准时代!EasyControl:Tiamat AI 联合上海科大开源图像生成控制框架
EasyControl 是基于扩散变换器架构的高效灵活控制框架,通过轻量级条件注入模块实现多模态预训练支持,具备任意分辨率生成能力和显著优化的推理效率。
78 1
让AI绘画进入「指哪画哪」的精准时代!EasyControl:Tiamat AI 联合上海科大开源图像生成控制框架
【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言
Multi-SWE-bench是首个覆盖Python外7种主流编程语言的代码修复基准,包含1632个真实GitHub问题样本,通过严格筛选与人工验证确保数据质量。
41 0
【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言
开源AI守护后厨——餐饮厨房视频安全系统的技术解析
餐饮厨房视频安全系统是一套融合开源AI技术与视频监控的智能化解决方案,涵盖实时检测、行为监测、数据分析、公众透明化及反馈闭环五大模块。系统通过YOLOv8、ResNet等算法实现后厨卫生与操作规范的精准监控,识别率达97%,问题响应时间缩短至秒级。同时支持后厨直播与监管对接,提升消费者信任和管理效率。其灵活开源的特点,为食品行业安全管理提供了高效、透明的新路径,未来可扩展至食品加工等领域。
这个AI能把PSD变视频!人物/场景/道具任意组合!SkyReels-A2:昆仑万维推出的可控多元素视频生成框架
SkyReels-A2是昆仑万维推出的创新视频生成框架,通过扩散模型和图像-文本联合嵌入技术,实现多元素精准组合与高质量视频输出。
82 25
漫画师福音!开源AI神器让线稿着色快如闪电!MagicColor:港科大开源多实例线稿着色框架,一键生成动画级彩图
MagicColor是香港科技大学推出的多实例线稿着色框架,基于扩散模型和自监督训练策略,实现单次前向传播完成多实例精准着色,大幅提升动画制作和数字艺术创作效率。
102 20
漫画师福音!开源AI神器让线稿着色快如闪电!MagicColor:港科大开源多实例线稿着色框架,一键生成动画级彩图
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
288 11
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题
OpenAI最新开源的BrowseComp基准包含1266个高难度网络检索问题,覆盖影视、科技、艺术等九大领域,其最新Deep Research模型以51.5%准确率展现复杂信息整合能力,为AI代理的浏览能力评估建立新标准。
59 4
GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题
用AI精准定位问题代码,调试时间直接砍半!LocAgent:斯坦福开源代码调试神器,多跳推理锁定问题代码
LocAgent是由斯坦福大学、耶鲁大学等顶尖机构联合开发的代码定位框架,通过将代码库转化为图结构并利用大语言模型的多跳推理能力,实现精准的问题代码定位。
61 1
用AI精准定位问题代码,调试时间直接砍半!LocAgent:斯坦福开源代码调试神器,多跳推理锁定问题代码
数字化转型具体应该从哪里入手?——生成式AI时代的战略行动框架
本文探讨生成式AI技术对数字化转型的深远影响,从战略认知、技术赋能、组织能力三个维度构建转型框架。强调需突破传统技术工具论,将AI视为战略伙伴;从数据驱动转向知识进化;由组织变革拓展至生态重构。同时提出具体实施路径,包括场景优先级排序、人机协作设计及技术债务管理,并结合培生认证项目阐述其在能力基准建立、战略合作与创新生态接入的战略价值,助力企业实现持续进化与价值创造的本质回归。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等