整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊

简介: 整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
12 月 15 日,Nature 子刊《自然 - 机器智能》发表了由华中科技大学人工智能学院发起、剑桥大学、斯坦福大学、约翰霍普金斯大学、MD 安德森肿瘤医院、华中科技大学同济医学院附属同济医院、附属协和医院、国家药物筛选中心等国内外权威科研机构联合开发的联邦学习开源医学人工智能(AI)计算框架(Unified CT AI Diagnostic Initiative , UCADI)。


人工智能技术正在变革传统医疗。但当前人工智能模型普遍泛化性差:模型在训练过的数据集上表现优异,但是对于未曾见过的数据,表现差别大。这个根本性的缺陷导致 AI 技术在医学、医疗应用中表现出的局限性,甚至安全问题更加突出。由于医疗数据受到个人隐私,知识产权,数据尺寸等多方面的限制,无法实现大范围、集中式的数据融合,当前医学人工智能模型通常只能在有限,甚至单一的数据集上训练。因此在这样条件下构建的医疗 AI 模型应用范围十分有限。

为了解决这个根本性问题,华中科技大学人工智能学院夏天教授与白翔教授团队提出基于联邦学习(Federated learning)开源医学人工智能计算框架(UCADI),并发表在了《自然 - 机器智能》上


论文地址:https://www.nature.com/articles/s42256-021-00421-z

此架构在保证数据安全与隐私前提下,无需传输数据,能在不同物理地点共享训练医学数据,构建泛化性强的医学 AI 模型。

不仅如此,基于 UCADI,夏天教授与白翔教授联合华中科技大学同济医学院附属同济医院、附属协和医院、武汉天佑医院、武汉中心医院、武汉儿童医院、国家药物筛选中心与英国剑桥大学医学中心(维护全欧盟新冠影像数据,包括全英 23 家医院)发起国际大合作,实现真正全球分布式共享新冠影像数据 AI 模型训练与构建。

UCADI 结构概览。

基于中英 23 家医院近万张的胸部 CT 扫描数据,研究团队验证了 UCADI 能够在保证用户数据隐私的情况下,多快好省地进行人工智能辅助诊断模型的训练和推理,实现跨国多中心的新冠病毒智能诊断。基于 UCADI 训练的 AI 新冠诊断模型相对于单个医院数据训练出的模型,不仅对新冠辅助诊断性能远超,同时在多个不同医院的验证数据集上表现出良好的泛化性与鲁棒性。

团队还进一步分析了模型的可解释性和不确定性,并验证了训练的 AI 模型能够捕捉到类似磨玻璃样阴影、小叶间隔增厚等新冠病人独有的 CT 特征。在此基础上,团队成员研究了数据异质性对模型性能的影响。

剑桥大学博士生、文章的共同一作王瀚宸发现“除了不同的医生、医院在 CT 的采集步骤上有所不同,国家与国家之间的差异更大。中英两国的 CT 数据有一个很大的区别是,中国的数据都是平扫,而英国的 CT 有很大一部分是注入造影剂后进行的增强扫描。此外,两国病人在年龄等属性上的分布也很不同,英国患者中的老年人比例非常高。这种数据上的异质性,对模型的训练是个很大的挑战。


为了应对这种数据异质性,团队首先进行了很多模型上的筛选和尝试,在几种常见的 3D 卷积网络架构中,最后选择 3D DenseNet。不仅是因为其较好的泛化性能,同时模型尺寸偏小,非常方便联邦学习中进行传输。但值得注意的是,3D DenseNet 也需要更多的计算资源。在此基础上,团队还尝试用 CycleGAN 在增强和平扫的 CT 间进行转换,取得了一些性能上的改善,但还是有相当的可提升空间。


此工作中,UCADI 框架初步展示了对于全球新冠数据的整合能力,基于全球范围数据构建的新冠诊断预测模型完全向全球开放使用,各国医疗机构可以在此基础上,利用 UCADI 进一步共享、更新、演进、优化预测模型。同时,UCADI 框架完全开源,可用于其他类型医疗数据,为未来的跨国智能诊断系统的研究与发展提供了基础设施。

团队已与剑桥大学和世界卫生组织 10 月份在德国新设立的疫情智能防控中心 (WHO Hub for Pandemic and Epidemic Intelligence) 建立进一步合作,重点研究现有的 AI 诊疗模型对识别新变种 Omicron 的鲁棒性,以及探索用持续学习 (Continual Learning) 等方法来开发一个可不断进化的联邦学习诊疗框架。

目录
打赏
0
0
0
0
368
分享
相关文章
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研
Qlib是微软亚洲研究院推出的开源AI量化投资平台,提供从数据处理、模型训练到组合管理的全流程支持,内置高性能数据基础设施和多种机器学习模型。
125 19
Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研
Cua:Mac用户狂喜!这个开源框架让AI直接接管你的电脑,快速实现AI自动化办公
Cua是一个结合高性能虚拟化与AI代理能力的开源框架,能在Apple Silicon上以接近原生性能运行虚拟机,并让AI直接操作系统应用。
115 17
Cua:Mac用户狂喜!这个开源框架让AI直接接管你的电脑,快速实现AI自动化办公
FinGPT:华尔街颤抖!用股价训练AI,开源金融大模型预测股价准确率碾压分析师,量化交易新利器
FinGPT是基于Transformer架构的开源金融大模型,通过RLHF技术和实时数据处理能力,支持情感分析、市场预测等核心功能,其LoRA微调技术大幅降低训练成本。
73 12
FinGPT:华尔街颤抖!用股价训练AI,开源金融大模型预测股价准确率碾压分析师,量化交易新利器
Java版Manus实现来了,Spring AI Alibaba发布开源OpenManus实现
此次官方发布的 Spring AI Alibaba OpenManus 实现,包含完整的多智能体任务规划、思考与执行流程,可以让开发者体验 Java 版本的多智能体效果。它能够根据用户的问题进行分析,操作浏览器,执行代码等来完成复杂任务等。
AI时代下的代理IP新机遇:解锁数据、安全与效率的隐形密码
在AI浪潮推动下,代理IP从辅助工具升级为数据采集与传输的核心基础设施。它突破地域限制、规避反爬机制,助力AI模型训练效率提升;通过智能路由和协议优化,实现高效稳定的数据传输;同时满足隐私保护与合规需求。在电商、金融、内容创作等领域,代理IP已成为不可或缺的效率与安全护航者。未来,智能化、合规化、全球化将成为其发展关键趋势。
24 0
AI框架的赢者法则:生态繁荣的昇思MindSpore,成为大模型时代的新选择
2024年被视为大模型应用的元年。昇思MindSpore AI框架凭借其强大的开源社区和技术创新,在全球范围内迅速崛起。截至2024年11月,该框架的下载量已超过1100万次,覆盖130多个国家和地区的2400多个城市,拥有3.7万名贡献者。昇思MindSpore不仅在人才培养和社区治理方面表现出色,还在大模型的开发、训练和应用中发挥了关键作用,支持了50多个主流大模型,覆盖15个行业。随着其市场份额预计达到30%,昇思MindSpore正逐步成为行业共识,推动大模型在各领域的广泛应用。
102 12
华为开源全场景AI计算框架MindSpore,性能可达 Pytorch+2080Ti 的1.93倍
华为开源全场景AI计算框架MindSpore,性能可达 Pytorch+2080Ti 的1.93倍
536 0
进击的 AI 框架,MindSpore 开源一周年
开源一年以来,累计发布 8 个新版本,汇聚超过 3000 名社区开发者的代码贡献,社区访问量超千万;现拥有超过 100 个大的基础模型,涵盖计算机视觉、NLP 等主流的 AI 和深度学习框架;累计 PR 数 超过 2 万个,下载量高达 22 万次,下载用户遍布全球;超过 100 所高校参与了社区活动,超过 40 家科研机构利用它去发表原创论文。这就是全场景 AI 计算框架 MindSpore 开源一年来取得的成绩!
339 0
进击的 AI 框架,MindSpore 开源一周年

热门文章

最新文章