与时间赛跑!阿里云医疗 AI | 心血管识别技术

简介: 在生命的道路上,你可曾感到与时间赛跑的惊心动魄?

AI.gif

在生命的道路上,你可曾感到与时间赛跑的惊心动魄?

其实,很多疾病若能“早检查早发现”,大可将其扼杀在萌芽时期。

阿里巴巴的医疗AI学会了心血管识别技术。它能从CTA影像中精准提取冠脉血管,效率比传统方法高出近百倍,仅需 0.5 秒即可完成检测。

医学影像诊断是医疗AI的热门应用方向,影像诊断的疾病谱系异常宽阔,遍及肝、肺、骨、乳腺、甲状腺、心脏等器官,心血管是其中公认的高难度领域,少有玩家能够触及。

抵达心脏之前,阿里先后创下肺结节检测、肝结节诊断技术的世界级突破。两年时间从肺、肝到心血管的“三级跳”,使得阿里AI进阶为医学影像AI领域的“全垒打选手”。

阿里AI正以肉眼可见的速度朝着“全器官”识别的终点线进化,阿里的肺结节检测、骨科辅助诊疗等新技术都已落地商用。

一旦在横向的疾病谱系和纵向的技术落地上都形成突破,医疗AI就将驱动影像科的技术变革。

没有影像学就没有现代医学

没有影像学就没有现代医学,伦琴发现X射线之前,我们无法透过皮肉看清自己的骨骼和器官——如果不考虑人体解剖的话。

现在,典型的影像科工作图景出现在全世界的医院,一群医生盯着一堆电脑,每天数以千计的图像从医生眼底划过。在中国的大医院,影像科医生每个工作日与电脑对视的时间常常超过10小时。这群人就是医院的视力洼地。

image.png

人是肉做的,大量机械重复动作消耗了精力和智力,也成为误诊和漏诊的原因之一。

新的技术变革正在发生,人工智能敲响现代医学的大门。全球每年产生万亿 GB 数量级的医学影像,如果能让机器辅助医生处理片子,多少智力资源将被解放,医生能做更多重要的事,比如多分一点时间给病人。

这是个“望山跑死马”的愿景,看着不远,出发了才知道有多难。

针对个别器官、个别病种,AI 尚且可作单点突围,但如要对各类器官全线取胜,对数据、算法、算力的要求就要提升几个量级。

同时,医学诊断是一套体系自洽、程序复杂并且不无骄傲的链路,新技术要嵌入其间,面临比其他场景难得多的落地关卡。

医疗 AI 为什么扎堆肺结节领域?

肺结节检测是目前人们最熟悉的医学影像 AI 领地。

肿瘤开始的时候可能只是一个结节。但很多肺癌病人在初次就医时,得到的判处就是晚期。

对抗这个头号恶性肿瘤,最好早发现、早诊断、早治疗,可肺结节不容易被察觉,早期结节大多不到10mm,一般不会引发明显不适,很多人因此错过了最佳治疗时期。

比起潜在患者数量,影像科能够消化的病例远不及社会需求。拍摄胸部CT筛查肺结节,每个病例的 CT 影像数量超过 200 张,一个医生每天最多处理几十例影像。高强度的疲劳战下,人工操作的误差不可避免。这是人工智能发挥价值的理想场景。

2017 年 7 月,阿里AI在国际权威的肺结节检测大赛 LUNA16 上打破世界纪录,凭借 89.7% 的平均召回率(在样本数据中成功发现结节占比的比例)夺冠。

image.png

LUNA16官网排行

大赛要求参赛队伍在 888 份肺部 CT 样本中寻找肺结节,样本包含 1186 个肺结节,75% 以上都小于10mm。阿里 AI 全程不用人工干预,自动读取病人的 CT 序列,直接输出检测到的肺结节。

2017 年在人工智能业界有“肺结节年”之称——目前已知的大部分AI肺结节检测技术突破都发生在这一年。如今,光是国内公司就有至少几十家宣称实现了肺结节检测算法。

肺结节检测成为医学影像 AI 的入门级领域,算法门槛上的原因有二,首先肺结节影像相对“易读”,影像画面直观、干扰因素少、特征规律可循;其次与肺结节相关的公开数据多,获取便捷,机器训练成本较低。

遗憾的是,对不少医疗 AI 来说,肺结节既是起点,也是终点。

从肝、肺到心血管,阿里AI的“三级跳”

想要打通医学影像疾病谱系,必须祭出硬通货——算法。

2017 年之后,阿里 AI 继续高速奔袭,连续拿下肝结节诊断和心脏冠脉提取的两项世界顶级赛事冠军,宣示了在算法领域无可匹敌的优势。

2018 年 12 月,阿里AI从近百支队伍中脱颖而出,在全球LiTS(Liver Tumor Segmentation Challenge,肝脏肿瘤病灶区CT图像分割挑战)获得两项第一。

肝脏是人体管状物分布最密集的器官,内含门静脉、肝静脉、肝动脉、胆管系统等多套管状系统。肝结节形态多样,结节间灰度分布差异大,与周围组织灰度相似甚至没有清晰的边界,对AI的“视力”挑战大于肺结节。

阿里 AI 通过对 CT 图像层间信息和层内信息融合的网络结构分析解决了肝结节类别多样性的问题,用到了基于原子卷积的空间金字塔池化(Atrous Spatial Pyramid Pooling)、亚像素卷积(Sub Pixel Convolution)等技术。目前,阿里团队正进一步研究如何判断肝结节的良恶性。

半年后,在 2019 年的心脏冠脉中心线提取鹿特丹比赛(Rotterdam)上,阿里 AI 获得全自动提取赛事第一名,相关论文被国际顶级医学影像会议MICCAI 2019 提前接收。

从CTA影像中准确提取心脏冠脉中心线是冠心病影像诊断的必备条件。通常的流程是,医生根据二维图像对血管进行三维重建,形成曲面重建视图,手动提取冠脉血管,寻找并标注血管斑块,判断血管病变性质,从而确定治疗手段。

心脏冠脉平均长度164mm,几何特性复杂、血管特别细小。比起肺结节的静态扫描图像,为不断跳动的心脏作三维图像重建棘手得多。传统的心脏冠脉中心线提取方法大多存在人工交互多、耗时长等缺点。

阿里AI提出了判别式冠脉追踪模型,三维卷积神经网络构成的模型,充分利用三维空间特征,从影像中迭代搜索完整血管,无需人工交互,提取单根冠脉血管平均耗时 0.5 秒,提取完整冠脉树用时不超过 20 秒,相比传统方法效率提升近百倍。

心血管疾病诊断的复杂性,导致AI医学影像识别在该领域应用极少。阿里的技术突破,让AI辅助医生进行心血管疾病诊断的未来变得近在咫尺。

从肺、肝到心血管的“三级跳”,姿态有多轻盈,算法就有多厚重。算法突破没有捷径,拼的就是人才浓度。事实上,阿里达摩院已经悄然聚齐国内最强 AI 研发者阵营——达摩院现有 10位IEEE Fellow、20 多位知名大学教授,一半以上科学家拥有名校博士学历。

夺冠以后,阿里 AI 还做了这两件事

光有算法远不足以推动技术落地。算法模型与现实场景的结合才是难点,具体到医疗 AI ,需要解决的问题很多,比如,如何在真实医疗环境中证明模型的准确率,如何解决真正的临床关切问题,如何确立服务模式和商业模式。

比起 LUNA16 夺冠,阿里在 2017 年做的另外两件事,更能显示其打法思路。

当年 3 月底,阿里云联合英特尔、零氪科技发起第一季“天池医疗 AI 大赛”, 以肺结节智能识别和诊断为课题,开展肺癌早期影像诊断的应用探索。16 家三甲医院的医师组成专家指导团,来自 20 个国家的2887 队伍报名竞技,整个赛程长达半年,部分优秀算法最终转化为了实际解决方案。

三个主办方各司其职,阿里云提供机器学习训练平台,单点支持数百 GB 内存,每次迭代可高速处理 32 张以上 128x128x128 甚至更大规模的 3D 图片;英特尔提供由第二代强融核处理器打造的高性能计算集群,保障高强度算力供应;零氪联合 16 家医院提供全球最大规模的 2000 份“科研级胸部CT数据集”。

这场非商业赛事动员了整个行业的智慧,推动肺结节检测的算法优化和技术沉淀。但它更重要的价值在赛事榜单之外——让专业医师与算法工程师走到一起,探讨影像学与 AI 的协作方式,从算法层面就关注 AI 嵌入医学流程的可行性。

“开放”一直是阿里追求的 AI 产业生态。阿里的 AI 平台能为中小企业提供人工智能基础设施和 AI 算法包,包括标准算法接入、运行环境托管、线上线下资源对接等服务,帮助企业快速低成本的构建专属智能应用。

不论以领路者身份做东办赛,还是在后方提供基础设施,都符合阿里一贯的平台思维和生态打法。也许是得益于这种开放思路,阿里的 AI 工程师总能比别人更早发现产业痛点,更懂得以需求为导向推动产品创新。

比如,AI 肺结节检测准确率逼近理论极值,但为什么医生们并不感冒?甚至有医院同时部署多个公司的多种算法,但并不特别依赖任何一种。

答案也不复杂,单项的肺结节检测技术,即便在真实场景中的表现不输于实验室,也无法提升影像科医生的整体效率。肺部疾病种类多样,肺结节只是其一,医生阅片不可能只排查这一种,机器不能真正减轻医生负担。

基于这样的判断,阿里团队在肺结节顶级赛事夺冠之后,马上投入了肺部综合诊断方案的研发,实现对六种常见肺部病变的影像诊断:肺密度增高影、肺索条、肺大泡、动脉硬化、淋巴结钙化和肺结节。综合方案涵盖了大部分肺部疾病的早期筛查,不论对于医院影像科还是体检机构,都有非常现实的作用。这项技术现已通过阿里云对外输出,累计服务近千万用户。

医学集成了人类这个物种最大的自负和自卑,我们一方面相信,这门凭借代际智慧和临床经验立身的专业充满不可言说的经验性,没有谁能比人做得更好;另一方面我们深知,我们对自己身体的了解非常有限,机器又如何能懂得更多?

image.png

没人怀疑AI医学影像符合未来医学的发展趋势,但研发者们仍要不断证明 AI 的价值,让医疗 AI 的服务模式跟上技术进步的节奏。

image.png

原文链接:https://mp.weixin.qq.com/s/mpbsSkEDzbE7leLaeDsRRw

目录
打赏
0
0
0
0
94
分享
相关文章
生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较
本文系统对比了扩散模型与Flow Matching两种生成模型技术。扩散模型通过逐步添加噪声再逆转过程生成数据,类比为沙堡的侵蚀与重建;Flow Matching构建分布间连续路径的速度场,如同矢量导航系统。两者在数学原理、训练动态及应用上各有优劣:扩散模型适合复杂数据,Flow Matching采样效率更高。文章结合实例解析两者的差异与联系,并探讨其在图像、音频等领域的实际应用,为生成建模提供了全面视角。
74 1
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
102 19
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
近年来,多模态表示学习在人工智能领域取得显著进展,CLIP和SigLIP成为里程碑式模型。CLIP由OpenAI提出,通过对比学习对齐图像与文本嵌入空间,具备强大零样本学习能力;SigLIP由Google开发,采用sigmoid损失函数优化训练效率与可扩展性。两者推动了多模态大型语言模型(MLLMs)的发展,如LLaVA、BLIP-2和Flamingo等,实现了视觉问答、图像描述生成等复杂任务。这些模型不仅拓展了理论边界,还为医疗、教育等领域释放技术潜力,标志着多模态智能系统的重要进步。
43 13
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
HarmonyOS Next~鸿蒙AI功能开发:Core Speech Kit与Core Vision Kit的技术解析与实践
本文深入解析鸿蒙操作系统(HarmonyOS)中的Core Speech Kit与Core Vision Kit,探讨其在AI功能开发中的核心能力与实践方法。Core Speech Kit聚焦语音交互,提供语音识别、合成等功能,支持多场景应用;Core Vision Kit专注视觉处理,涵盖人脸检测、OCR等技术。文章还分析了两者的协同应用及生态发展趋势,展望未来AI技术与鸿蒙系统结合带来的智能交互新阶段。
61 31
Python下的毫秒级延迟RTSP|RTMP播放器技术探究和AI视觉算法对接
本文深入解析了基于Python实现的RTSP/RTMP播放器,探讨其代码结构、实现原理及优化策略。播放器通过大牛直播SDK提供的接口,支持低延迟播放,适用于实时监控、视频会议和智能分析等场景。文章详细介绍了播放控制、硬件解码、录像与截图功能,并分析了回调机制和UI设计。此外,还讨论了性能优化方法(如硬件加速、异步处理)和功能扩展(如音量调节、多格式支持)。针对AI视觉算法对接,文章提供了YUV/RGB数据处理示例,便于开发者在Python环境下进行算法集成。最终,播放器凭借低延迟、高兼容性和灵活扩展性,为实时交互场景提供了高效解决方案。
AI战略丨从探索到突破,全面解读智实融合关键技术
关键技术的发展水平直接决定了智实融合的深度与广度,是其应用进一步拓展的关键因素。
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
在新加坡 ElasticON 2025 的 Elastic 合作伙伴峰会上,阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024!
达摩院悬壶,看医疗 AI 如何济世
抗疫正当时,不论是与浙江疾控中心合作的基因检测平台,将疑似病例基因分析时间缩至半小时,还是率先在郑州“小汤山”应用的 CT 影像系统,达摩院、扫地僧,都成为阿里 AI 抗疫的代表性标签。
1290 0
达摩院悬壶,看医疗 AI 如何济世
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
本文介绍了如何使用阿里云提供的DeepSeek-R1大模型解决方案,通过Chatbox和Dify平台调用百炼API,实现稳定且高效的模型应用。首先,文章详细描述了如何通过Chatbox配置API并开始对话,适合普通用户快速上手。接着,深入探讨了使用Dify部署AI应用的过程,包括选购云服务器、安装Dify、配置对接DeepSeek-R1模型及创建工作流,展示了更复杂场景下的应用潜力。最后,对比了Chatbox与Dify的输出效果,证明Dify能提供更详尽、精准的回复。总结指出,阿里云的解决方案不仅操作简便,还为专业用户提供了强大的功能支持,极大提升了用户体验和应用效率。
1194 19
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等