全球首场神经影像人机对决:AI战胜25位医界“最强大脑”!

简介: 昨天,备受关注的全球首场神经影像人机大战在国家会议中心举行,在脑肿瘤和脑血管影像判读比赛中,医疗AI最终以高出20%的准确率战胜25名人类医生。如果这款AI产品投入实用,核磁检查的出片速度将从现在的几天缩短至几分钟。

【新智元导读】昨天,备受关注的全球首场神经影像人机大战在国家会议中心举行,在脑肿瘤和脑血管影像判读比赛中,医疗AI最终以高出20%的准确率战胜25名人类医生。如果这款AI产品投入实用,核磁检查的出片速度将从现在的几天缩短至几分钟。

2018年6月29日-30日,一场AI vs人类医生的“读片大战”在北京国家会议中心展开。

这场比赛由国家神经系统疾病临床医学研究中心、首都医科大学人脑保护高精尖创新中心和中国卒中学会联合主办,是全球首场神经影像人工智能人机大赛。

参加比赛的双方,AI这边是一个名叫“BioMind 天医智”的系统,由国家神经系统疾病临床医学研究中心与首都医科大学人脑保护高精尖创新中心、北京安德医智科技有限公司共同研发,号称全球首款CT、MRI神经影像人工智能辅助诊断产品。

人类这边,则由25名全球神经影像领域顶尖专家、学者和优秀临床医生组成,他们中有拥有几十年临床工作积累的影像学大咖,也有有志于AI系统研究的青年科技人才。经过前期招募、预赛及定向邀请选拔而出。

经过紧张激烈的角逐,在两轮比赛中,BioMind分别以87%、83%的准确率,战胜医生战队66%、63%的准确率。值得一提的是,两轮比赛BioMind均仅用15分钟左右时间便答完所有题目,而医生战队几乎答到最后一秒。

image

image

A组比赛结果

神经影像人工智能人机大赛赛制介绍

据了解,大赛将分A、B组进行,内容包括:颅内肿瘤CT、MRI(核磁)影像判读;脑血管疾病CT、MRI影像判读及血肿预测;脑血管病(狭窄、微出血、梗死、脑白质病变、腔隙灶、血肿)病灶标识,出血体积及梗死体积测量。

image

A组比赛中,有15名人类医生,包括此前全国线上预赛产生的优胜者6名、国内神经疾病排名前列的专家7名,以及国外知名医院专家2名。本组试题共225题,人类选手每人回答15题,AI 回答225题,最终以人类选手整体成绩与AI对比。

image

B组比赛由10名人类神经影像领域“大咖”(国内神经疾病排名前列医院专家8名+知名医院的专家2名)和AI比赛。其中,每名人类选手都与AI一样,完成30道题的挑战,最终将以人类选手整体成绩 VS AI成绩。

A组试题为首都医科大学附属北京天坛医院神经影像学中心主任高培毅教授从天坛医院脑肿瘤病例库中随机挑选,B组为首都医科大学附属北京天坛医院常务副院长王拥军教授从国家神经系统疾病临床医学研究中心脑出血病例库随机挑选,两组试题均非AI训练试题,为保证试题的保密性,北京市长安公证处的公证人员为试题挑选、封存进行了公证。

赛前,公证人员正式为试题解封,并交付本次决赛评审专家,进行最终题目抽取。据了解,由于本次比赛使用的病例均为首都医科大学附属北京天坛医院病例库中回顾性病例,因此,最终评判结果以医院最终病理结果为准。为保证准确性,选手开始答题后,评委对试题结果进行二次审核。

最终,在A组比赛中:225例判读,AI用15分钟准确率达87%,15位医生用30分钟准确率达66%;B组比赛中,10名顶尖医生对战AI,同样完成30道脑血肿扩大预测试题,AI以83% VS 63% 准确率胜出。

获胜医疗AI:每个肿瘤背后都学习了1000个病例,基本掌握50种颅脑肿瘤

参加比赛的AI——BioMind天医智,是由国家神经体系疾病临床医学研讨中心和首都医科大学人脑维护高精尖立异中心等一起研制的全球首款CT、MRI神经印象人工智能辅佐确诊产品。

在参加比赛前,它已经跟着北京天坛医院神经影像学中心主任高培毅学习了半年。

对于本次比赛AI学生取得的成绩,高培毅并不意外,他介绍说,通过对北京天坛医院近十年来接诊的数万余神经系统相关疾病病例影像的系统学习,“BioMind天医智”在脑膜瘤、胶质瘤等常见病领域的磁共振影像诊断能力相当于一个高级职称医师级别的水平,实力不容小觑。

“每种肿瘤背后,它都学习了1000个病例,目前基本上已经掌握了50种颅脑肿瘤,这是任何一名医生都难以实现的。”


image

在近期“人机大战”决赛备战中,高培毅还为提高AI体系应战表现打开集训。300多个病例,陪练医师们需10小时以上时刻才做完结,AI只需不到半小时。除了学习速度外,它的安稳性也显着逾越人类。“不知道累,也不受外界搅扰要素的影响。不像医师会被心情、状况、时刻地址等外界要素打扰,然后影响描绘准确性。它永久坚持镇定,水平安稳。”

不过,他对自己AI学生的表现还不太满意。“对它的比赛成绩不够满意,我认为它的准确率应该在90%以上,”高培毅说,接下来他们将对AI的“丢分”原因进行研究分析。

战胜25位医生≠战胜人类医生,AI和专业医师仍然存在差距

image

关于这次比赛结果,中国科学院院士、第三军医大学病理学研究所所长、西南医院病理科主任卞修武表示,“我希望大家不要产生对立性思维,因为无论医生胜还是人工智能胜,对于医疗界和广大患者都是一件大好事。”卞修武认为,人工智能更聚焦于某一细分领域,但医生有其系统性的学习,所以人工智能如果能作为一个帮手帮助医生工作,将会是医生的一大福利。

美国卡内基梅隆大学(CMU)计算机科学学院副教授马坚告诉新智元,AI对一些特定的问题在特定的时间内比人做得更好,这类事情之前也发生过,这可能是又一个有意思的案例。但是,通过 AI 和几个医生的比赛的结果,就说AI战胜某个整个的职业领域肯定不妥。

马坚表示,目前AI对单一数据源的分类可能做的不错,但是如何从复杂的多模态数据中有效综合作出诊断和治疗意见,AI可能还有非常多问题要解决,而且,这还涉及到更多社会学意义上的问题,譬如AI和医生以及病人互相间信任、沟通的问题。

BioMind的老师高培毅也表示,“觉得它容易就能代替医师的人,把医师的作业看得太简略了。”AI在大数据深度学习方面确实具有巨大的优势,不过在实践确诊中,放射科医师仍具有很强的不行代替性。

“除了影像查看,一个合格的放射科医师还需求看化验单、体检单,问询宗族史、个人病史,了解患者从前接受过的药物、医治、反响。归纳以上状况后,才敢做出确诊。”AI或许能够代替“看片匠”的任务,但不可能成为一个真实的医师。

王拥军也以为,人工智能使用能够将医师们从单调、重复的作业中解放出来,然后腾出更多时刻进行开发性作业。

  

此外,现在AI在神经体系印象确诊方面,仍彻底依赖于数据真实性和质量的支撑,在缺少大数据支撑的疑难病、稀有病确诊范畴,AI和专业医师之间仍存在距离。

使用AI辅助,核磁检查结果有望缩短至几分钟

王拥军表示,这次向全球招募神经科医师打开“人机大赛”,意图主要是为了验证天医智确诊的准确性。

目前,全国影像科人才资源地域性分配不均衡问题十分突出。以脑肿瘤为例,北京天坛医院每年手术量约为一万例,而在大部分底层医院,这个数字可能只停留在两位数。大多数患者即便在底层做了查看,仍是会挑选带着片子到三甲大医院来看,有的在“上流”的过程中重复屡次拍片,形成资源糟蹋。假如底层医院能使用AI技能为确诊赋能,让底层医师在读片确诊上与大医院具有平等水准,提高医治功率,就能削减患者不必要的医治环节和经济损失,也能减轻大医院压力。

此外,在天坛医院,天医智有用发掘信息与疾病的潜在联络的才干还可辅佐医师对疾病做出更为精准的猜测,如猜测患者血肿后是否会大出血的准确度,可从人为判别的60%提高至90%,辅佐医疗团队提早为患者可能遇到的风险供给处理方案。

这次比赛,医疗AI表现出了速度快、准确率高的结果,令人赞叹的同时,更多人关心的是它未来将给神经医学带来哪些改变——人脑疾病真的可以实现电脑诊断吗?

高培毅介绍说,一个CI病例背后,可能是近千张片子,天坛医院一个影像大夫每天读片诊断的时间甚至达到18个小时。按照“BioMind天医智”目前的速度,一个大夫一天的工作量,它只需要400-500秒,也就是不到10分钟的时间。

“现在患者到医院做核磁,结果都要等第二天以后才能拿到。如果让AI来做,那么核磁结果基本上立等可取,几分钟就行”。

  

北京天坛医院院长王拥军介绍说,目前已经向国家药监局提交申请,希望在临床中应用这款AI产品,提高基层医院影像诊断准确率,同时也提高影像判读速度,为患者节约时间。

不必担心机器在临床技术上超越人类医生

北京大数医达有限公司创始人、CMU博士邓侃在了解到这项比赛后,给出了如下的点评:

以往司机必须具备三种能力,第一种是规划路径的导航能力,熟悉地图,能够规划从起点到终点的合理路径。第二种是驾驶汽车的操作能力,包括踩油门、踩刹车、转方向盘等等。第三种是对交通实况,迅速做出判断的能力,譬如避让行人,如何处理其它车辆超车。

有了导航软件以后,司机们不再需要熟记地图,不再需要第一种能力。随着无人驾驶技术的发展,不久的将来,司机们也不再需要第二种和第三种能力。

随着人工智能医疗技术的发展,人类医生也将不再像以往那样,依赖临床经验的个人积累,而是越来越依赖电脑的提示。

读片是医疗过程中,诊断的一个环节。输入是检查设备生成的影像,输出是文字版的检查报告,检查报告中包括两部分,一个是检查所见,列出检查影像中需要关注的特征标志物。另一个是检查结果,根据检查特征标志物,判断患者罹患的疾病。

昨天北京举办了一场AI vs人类神经科医生的读片大赛,在A组比赛中,225例判读,AI 系统用 15分钟完成读片,准确率达87%,15位医生用30分钟准确率达66%;B组比赛中,10名顶尖医生对战AI,同样完成30道脑血肿扩大预测试题,AI 系统以83% vs 人类医生 63% 准确率胜出。

昨天的比赛,人工智能系统以 20% 的显著优势,战胜人类医生。这说明,在某几类疾病的读片中,人工智能确实比人类智能更有优势。而且,不久的将来,在其它疾病的读片中,机器也势必超越人类。

整个诊断过程,包括问诊、体检、化验、检查。读片只是检查这个单个环节。不久的将来,机器势必在诊断和治疗全过程,而不仅仅是读片单个环节,超越人类。人工智能医疗,下一步的发力点,一定是诊断和治疗的全过程的整合,把问诊、体检、化验、检查全部串连起来。

人类医生会失业吗?医疗界有句名言,“To Cure Sometimes, To Relieve Often, To Comfort Always,有时是治愈;常常是帮助;总是去安慰”。也许机器在治愈和帮助方面,确实比人类医生更精准,但是患者需要关怀,需要安慰,医生提供的“话疗”,哪怕是无声的一个同情的眼神,机器能难替代人类医生。

不用担心机器在临床技术方面超越人类,就像不用担心导航软件和无人驾驶技术,超越人类司机一样。 历史经验表明,机器取代人类,完成繁琐的工作,让人类腾出手去,完成更精巧的工作。全球人口发展的历史也表明,随着机器的普及和进步,人类人口非但没有下降,反而不断增加。

(本文部分内容综合自北京青年报、人民日报、健康界等报道)

原文发布时间为:2018-06-27
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。
原文链接:
全球首场神经影像人机对决:AI战胜25位医界“最强大脑”!

相关文章
|
7月前
|
人工智能 算法 数据可视化
AI Earth ——开发者模式案例2:Landsat系列影像数据去云
AI Earth ——开发者模式案例2:Landsat系列影像数据去云
135 3
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
54 25
|
4月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【8月更文挑战第1天】在当今科技飞速发展的时代,AI已成为日常生活中不可或缺的一部分。神经网络作为AI的核心,通过模拟人脑中的神经元连接方式处理复杂数据模式。利用Python及其强大的库TensorFlow,我们可以轻松构建神经网络模型。示例代码展示了如何建立一个含有两层隐藏层的简单神经网络,用于分类任务。神经网络通过反向传播算法不断优化权重和偏置,从而提高预测准确性。随着技术的进步,神经网络正变得越来越深、越来越复杂,能够应对更加艰巨的挑战,推动着AI领域向前发展。
56 2
|
1月前
|
机器学习/深度学习 人工智能 算法
AI在医疗影像诊断中的应用与未来展望####
本文深入探讨了人工智能(AI)在医疗影像诊断领域的最新进展、当前应用实例及面临的挑战,并展望了其未来的发展趋势。随着深度学习技术的不断成熟,AI正逐步成为辅助医生进行疾病早期筛查、诊断和治疗规划的重要工具。本文旨在为读者提供一个全面的视角,了解AI如何在提高医疗效率、降低成本和改善患者预后方面发挥关键作用。 ####
|
1月前
|
机器学习/深度学习 人工智能 算法
探索AI在医疗影像诊断中的应用
探索AI在医疗影像诊断中的应用
|
2月前
|
机器学习/深度学习 人工智能 算法
Nature子刊:AI模型测大脑年龄,究竟哪些因素会加速大脑衰老?
【10月更文挑战第7天】《自然医学》杂志近期发布了一项研究,介绍了一种名为BrainAge的人工智能模型,该模型可预测个体的大脑年龄并分析影响大脑衰老的因素。研究团队来自美国加州大学旧金山分校,利用英国生物银行的近50,000名参与者的数据,发现高血压、糖尿病、肥胖、吸烟、饮酒、缺乏运动及遗传因素均与大脑衰老有关。尽管存在数据集限制等局限性,BrainAge模型仍为研究大脑衰老和相关疾病提供了重要工具。
70 1
|
2月前
|
机器学习/深度学习 人工智能 算法
AI辅助医疗影像:提高诊断准确性
【10月更文挑战第2天】医学影像技术是现代医学诊断的关键手段,但传统方法依赖医生经验,存在误诊风险。AI辅助医疗影像通过自动化图像识别、疾病预测和辅助诊断决策,显著提升了诊断准确性与效率。利用深度学习、数据增强及迁移学习等技术,AI不仅能快速分析影像,还能提供个性化诊疗建议,并实时监测疾病变化。尽管面临数据质量、算法可解释性和伦理法律等挑战,但多模态影像分析、跨学科合作及VR融合等趋势将推动AI在医疗影像领域的广泛应用,助力实现更精准、高效的医疗服务。
|
3月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【9月更文挑战第12天】在当今科技飞速发展的时代,人工智能(AI)已深入我们的生活,从智能助手到自动驾驶,从医疗诊断到金融分析,其力量无处不在。这一切的核心是神经网络。本文将带领您搭乘Python的航船,深入AI的大脑,揭秘智能背后的秘密神经元。通过构建神经网络模型,我们可以模拟并学习复杂的数据模式。以下是一个使用Python和TensorFlow搭建的基本神经网络示例,用于解决简单的分类问题。
54 10
|
4月前
|
机器学习/深度学习 人工智能 算法
AI在医疗影像识别中的应用与实践
本文综述了人工智能在医疗影像分析的应用,涵盖了基础理论、操作流程、关键算法及实践案例。通过探讨卷积神经网络等技术,展示了如何构建医疗影像分析系统并提高诊断精度和效率,为医疗行业的创新发展提供了有力支持。
|
4月前
|
机器学习/深度学习 人工智能 编解码
国际奥委会采用阿里云AI云技术修复奥运历史影像
国际奥委会采用阿里云AI云技术修复奥运历史影像
138 4