在2017年那场史诗级的围棋对决中,人类战力最强的棋手柯洁以0∶3败于阿尔法狗,人类终被自己的模仿品——人工智能(AI)超越。接下来,它会在哪个领域战胜人类?猜测落在医疗上。
人工智能在多个医疗细分领域曾与人类医生交手,2016年5月至今,比分结果是AI 6胜、3平、2负。医生已然落于下风。
2017年岁末,斯坦福大学教授吴恩达领导的机器学习小组开发出一种名为CheXnet的算法,能够更敏锐地捕捉胸部X光片中的肺炎迹象,在诊断肺炎的比拼中,也一举击败四名放射科医师。
这些火种足以让产业界信心爆棚。谷歌、IBM、英特尔等国际巨头和国内的“BATK”(百度、阿里、腾讯、科大讯飞),都加紧布局,一大批初创公司也喷涌而出。
人口老龄化加剧、慢性病患者群体增长、优质医疗资源紧缺、公共医疗费用攀升等多重压力,使AI入医疗被寄望成为这一全球性压力的泄压阀。泄出的压力也正是机遇的源头。尤其在中国,人口数量成为优势,医疗数据的基础大,可以给医疗AI提供充沛的燃料。业内的普遍看法是,在该领域,国内企业有弯道超车的机会。
然而,AI的泡沫已然吹起,医疗能否独善其身?这将取决于研究成果能否尽快进入临床,并获得大范围应用,给医疗带来切实改进,以撑起领域公司的估值,冲破“C轮死”的魔咒。
向医生的主场渗透
击败四名放射科医师,CheXnet只经历了一个月的诊断学习。
AI已经在预测中风和心脏病发作、预测婴儿自闭症的风险上表现出明显优势;在外科手术和阿尔茨海默病预测中略胜一筹;在治疗脑肿瘤、先天性白内障诊断和皮肤癌诊断上,跟人类医生打平。“这些示范性的案例,就是一轮又一轮大额度融资的信心来源。”亿欧智库医疗产业分析师尚鞅告诉《财经》记者。过去一年,资本对医疗AI的热情展露得非常明显,因为落地的可能性被印证了。
此前的人机对战都在研发阶段,直到一年前,美国批准了第一个用于临床的医疗AI产品,它可以分析心脏核磁共振图像,准确度可与有经验的医生相媲美。进入临床,是AI向产业化迈进的一大步。
2017年,国内医疗AI行业公布的融资事件近30起,融资总额超过18亿元。融资额最高的一笔是AI医学影像公司汇医慧影数亿元B轮融资。
“能够在如此短时间内让投资界集体高潮,一定是出现了商机。”易凯资本有限公司健康产业组联席负责人李钢分析。
就医,最核心的部分是诊断。替代医生诊断,是医疗AI的一个终极目标。现阶段的小目标是,能够让AI为医生的诊断及治疗方案提供建议,辅助诊疗。
如何让人工智能和人类医生一起,实现任何单一方都无法提供的临床效果,才是关键。
AI辅助医生做事,先从那些繁琐的、重复性工作起步,提升诊疗效率。企业和研究团队分头趟开两条路:一条基于自然语言处理,根据病历和症状诊断疾病;一条基于计算机视觉,通过识别医学影像诊断疾病。
IBM公司开发的“沃森”(Watson),是第一条路径代表。它四年学习了200本肿瘤教科书、290种医学期刊和超过1500万份的文献后,尝试在14个国家的多个肿瘤治疗中心临床应用。在输入患者的年龄、性别、体重等基本情况和癌症分期、局部复发、化疗方案、病理分期、癌症转移等具体内容后,短短十多秒,沃森就会给出治疗方案,在肺癌、乳腺癌、直肠癌、结肠癌、胃癌和宫颈癌等方面为医生提供诊断建议。
肿瘤医生的智能助手沃森落地中国非常迅速,其国内代理商——百洋智能科技在去年5月曾透露,一年内将有150家地市级的三级综合医院引进沃森。然而,沃森面临的问题是,虽然速度快,但给出的解决方案可能还不是最好的。
第二条路径,AI可将复杂、高维度的医学影像数据,降维使其更易处理,因而可以快速、准确地从医学影像中发现病症的信息,辅助医生诊断。
医学影像在医疗数据总量中占比约80%,包括CT、核磁、超声、病理、内窥镜、眼底等,因而,医学影像的计算机处理向来是一个庞大的产业。
全球知名风投调研机构CB Insights对美国106家医疗AI初创企业分析显示,影像和诊断成为资本热涌的重点领域。IBM和阿尔法狗的开发者DeepMind都在推进AI医学影像的应用,阿里、腾讯也不甘人后。
实际上,AI的触角已无处不在。运用语音识别和自然语言理解,医生在诊疗过程中即可完成病历编写,能提高医生工作效率,美国大概有72%的医院已经实现用语音收集医疗信息,科大讯飞、云知声等均有此项业务。
一些初创公司,还喜欢挤入慢性病管理,即运用人工智能算法,对慢性病患者进行实时健康监测及干预,甚至据此生成健康管理建议,主要针对糖尿病、心血管病等需要即时干预的慢性病患者。
而一年多前,很多一线医生还不知道AI这个字母组合是什么意思。“在过去的12个月,关于医疗AI的各种信息,很多一线医生都在听和看,这是一个很好的趋势。”上海长征医院眼科主任医师魏锐利对《财经》记者说。
2017年11月,由独角兽工作室等联合发布的《医疗人工智能医生认知情况调研报告》显示,77%的医生至少听说过一种医疗人工智能应用。
催逼AI箭上弦,本质上还是好医生稀缺。蓝驰创投合伙人陈维广,在投了春雨医生之后,他多次接到朋友的请求,让帮忙找好医生。对医疗的需求提升,是全球普适的驱动因素,而人口老龄化就是那块巨大的背景板。
像一副摆好的多米诺骨牌,全球人口老龄化加速,老龄化社会之后就是医疗资源匮乏。美国人口普查局报告显示,至2015年,全球65岁及以上人口超过6亿。这一年,中国65岁及以上人口约1.44亿。
英特尔医疗与生命科学部亚太区总经理李亚东介绍,目前全球约30%的医疗资源为65岁以上的人群所占用,50%的医疗资源为55岁以上的人群占用。
国内对AI最现实的期待是,纾解三甲医院爆满的困境,协助提升县乡镇的医疗水平,以免漏诊、误诊。
依然是数据为王
一个十分明显的趋势是,AI往医学影像领域扎堆。
动脉网数据显示,国内83家医疗AI企业中,一半涉足医学影像。“(这一领域)正处于黄金期,除提高效率之外,它能找到人力无法找到的病征,今后完全取代医生读片是完全可能的。”海银资本创始合伙人王煜全向《财经》记者分析。
技术驱动因素之外,还有一个重要的底层逻辑在运行。“离开临床数据,AI没法思考。”北京大学肿瘤医院信息部主任衡反修在很多会议上强调这一金句。
AI的开发很像教孩子,需要花时间训练它,给它喂大量数据,同时告诉它什么是错的,什么是对的。通过这种有监督的学习,AI才能成长。
就像早期阿尔法狗的训练一样,医疗AI的训练也得有“棋谱”——以医学影像为例,就是大量由医生标注出重要信息的影像数据集。不过,围棋有统一规则,而人的病例复杂得多,因此,获得高质量的、经标注的影像大数据集,需要大投入。
万里云医疗信息科技(北京)有限公司CEO黄家祥认识一位AI医疗创业公司的创始人,刚融到几千万元投资时十分开心,但不到一年就发现,差不多一半的资金得用在数据标注上。
相对于基因、病理等的数据,获取医学影像数据更容易一些,且本身就是结构数字化的,加之原来就有一些公开的标注数据集,所以一大批创业公司才蜂拥进入影像领域。
基于同样的逻辑,在AI医疗技术的开发中,最重要的不是AI技术哪家强,而是看谁能与医院建立良好合作,因为医院手中既有医疗数据,又有能对数据进行标注的医生资源。
实际上,中国的医疗大数据一直存在应用障碍,信息孤岛现象明显,国内95%医院的电子病历还未全院流通。换句话说,医疗大数据的地基尚未打好。
在医疗过程中,很多最基本的医疗术语尚不能统一,如阑尾炎和盲肠炎或食管癌和食道癌,说的是一个病,但录入数据库后,计算机会把它分成两种病。
医疗数据不准确、不完整,增加数据挖掘难度的同时,也降低了数据本身的价值。河南省安阳市肿瘤医院每年完成2200台-2500台的食管癌手术,稳居世界第一。但该院院长徐瑞平教授坦陈,“我们做了这么多手术,在国内食管癌的(学术)地位并不高。”原因就是数据质量不高,后期对病人的随访不够,导致数据不完整。
要想让AI深入,就需要协调电子病历、化验和影像系统、医生记录和医疗保险索赔材料等多方的大数据,这明显是个难上加难的任务。
即使在先行者美国,也有同样困境。《数字美国》报告显示,美国有近四分之一的医院和超过40%的医生尚未采用电子健康记录系统。即便有电子记录系统,也没有与病人或其他提供者无缝共享数据,因为这些系统无法互通操作,病人需要反复讲述他们的病史。
况且,医疗AI在全球都面临着一些独特的高难度障碍:医疗数据的敏感性和严格的保护隐私规定,限制了AI医疗所要求的高质量聚合数据的收集。如美国医院对患者隐私有很多保护,医院数据不能轻易开放给AI公司。
嘉御基金的创始人卫哲注意到一个趋势,很多国外从事医疗行业的公司在寻找中国的合作伙伴,因为中国人口同样众多,隐私的保护却没有那么严格,有机会让医疗数据迅速地集中起来。
真正决定中国产生后发优势的,依然是数据够大。李钢观察到,现阶段中国医疗AI产业对美国风向的跟从效应明显。但未来,人口与数据的优势将可能使中国企业狂飙。
还没有看上去那么美
AI公司多数都在帮医生做科研,或在提高诊断效率方面做尝试,真正深入到临床流程的很少。对AI将会在多大程度上替代医生,业界有两种不同态度:AI工程师雄心勃勃,认为阿尔法狗的胜利就是最好的证据;医生们则疑虑重重,至少还不担心自己的饭碗会被AI抢走。
《医疗人工智能医生认知情况调研报告》显示,外科和影像科医生对AI的知晓率高于平均水平,但对AI的整体满意度也低于平均水平。不满意主要集中在AI未能减少医生的工作量,其次是对原理的质疑以及准确率不高。
很多使用过阅片AI的影像科医生,没有体会到工作量降低。魏锐利表示,AI分析过的影像,医生还得重新复核一遍。因为担心漏诊,也就是提示有患病可能的影像,没有被识别出来。
所有医疗影像AI公司都会宣称自己的产品比医生阅片速度快得多,准确率要高,但没有谁敢说能够杜绝漏诊问题。这让医生难以完全信赖阅片AI。一旦医生觉得有风险,他就得审核AI看过的所有图像。
漏诊的产生,问题很可能出在训练数据上。黄家祥介绍,很多AI创业公司都是靠公开的数据源起步的,训练的数据量非常有限;还有些公司跟一两家医院合作,把服务器放到医院去训练,也能训练出一个AI模型来,而且对于单一病种,测试效果可能也不错。但如果换了另外一个不同的数据集来测试,很可能就“水土不服”了。
一些AI创业公司会辩解称,自家的AI产品与医生相比,降低了漏诊率。对这种说法,Wision AI的联合创始人刘敬家不以为然,中国目前没有关于医生漏诊的准确数据,如何得出AI的漏诊率比医生低的结论?
所有医疗影像AI公司都会宣称自己的产品比医生阅片速度快得多,准确率要高,但没有谁敢说能够杜绝漏诊问题。
“目前来讲,AI所取得的成果还远远没达到预想的目标。”魏锐利说。放眼看,大多数公司的AI产品还处于研发阶段。
华盖医疗基金董事总经理施国敏曾撰文称,人们脑补的人工智能替代医生,哪怕仅仅是辅助,在产品层面也尚未出现。
现阶段的AI都是弱人工智能,其主流的深度学习方法存在一个明显的缺陷,即它的过程无法描述。换句话说,AI算法的整个过程犹如一个专用的、无法打开的“技术黑箱”,所谓可用不可见。它既没有普遍的适应性,也无法拆解出具体的智能化业务规则,而且高度依赖于参与训练的海量数据。
深度学习的特点是有问必答,只要有数据输入,就有结果输出。但刘敬家分析,如果没有金标准对结果进行校验,很可能输出错误的结果,而且很容易蒙蔽人。
医学是注重证据的学科。顶级医学期刊《新英格兰医学杂志》去年发表文章,对深度学习在医学预测领域的应用进行了分析,认为那些没有探明的医学逻辑支撑,妄想通过堆砌更多维度的数据而有所发现的行为,最终会陷于蝴蝶效应的困境之中。也就是初始条件的微小变化,都可能累计出结果的巨大变化。
“技术黑箱”中仅有数学公式推导,却没有明确的理论解释其决策过程。
医生们担心,这种思维用于简单的类似于医学影像标准等的工作尚无大碍,一旦涉及更为复杂的医疗决策辅助,甚至医疗方案的整体评估建议,不考虑决策过程完全以结果为导向去辅助医护人员,会让医护人员陷于被动,甚至暴露在难以控制的决策风险中。
美国医疗媒体STAT在2017年10月连发两篇调查报道,分析沃森的“超级功能”中存在的技术缺陷,并指出美国现有法律框架对于医疗AI监管的疏忽之处。
美国一些医生和消费者团体认为,正是因为AI算法具备“技术黑箱”的特点,监管方需要对像沃森这样的医疗AI辅助诊断系统进行更加仔细的检查和监管。
这个新兴领域排头兵,在中国还将面临政府部门从不同的角度和方面来管制医疗健康领域,往往出现政策之间的不协调,或者部门之间的利益冲突和权力冲突,使得这些创新创业者难以应付。中欧国际工商学院卫生管理与政策中心主任蔡江南为《财经》撰文称,由于缺乏对于制度和政策的了解,许多创新和创业项目往往包含了制度风险和政策风险,一旦政策执行过程中出现橡皮筋的上下波动,这些项目就可能夭折。
“C轮死”魔咒
活过2018年,是很多医疗AI公司的决心。
融资青黄不接、技术迭代的瓶颈,以及商业模式断裂,哪一条都有可能拖垮靠技术吃饭的初创企业。
李钢观察到,当细分行业龙头融资纷纷达到亿元级别后,其中领先企业融资最困难的阶段就近在眼前了。
这是因为,对风险偏好较高的风险投资者而言,细分行业龙头需要的融资额已经超过他们能够投资的体量;而对于较大体量的私募基金而言,这些行业龙头依然处于商业化的探索阶段,没有亮眼的财务数字却顶着极高的估值,实在无法下手。由于亿元级别的融资相当于B轮融资,因此,这个规律被称为“ C轮死”魔咒。
现在,AI医疗影像行业的头部企业,已经进入C轮的那道缺口之中。
黄家祥也认为,2018年对于很多医疗AI公司来说都是一个巨大的挑战,“可能会淘汰掉一批,不光是融资层面的,还包括一些成长不上去的”。
亲身遇到的案例,也加深了黄家祥这一判断。一个人工智能团队用了约两周时间,从一个公开的数据源,训练出一个初步的AI产品,这一团队找到万里云求助一些脱敏的测试数据,黄家祥提供了一部分数据,对方测出了90%的准确率。
看上去技术门槛似乎并不高,帮助了一些创业企业在短时间内取得一定的成果。然而,“没法实现商业价值,就只是一个基础的研究成果,只能用来秀一秀。”黄家祥十分笃定,这让很多人错误地判断了形势,第一步好迈,但往后走还有没有资源支撑更加重要。
医疗AI跟阿尔法狗一样,需要不停迭代升级。这意味着,要不停用数据去训练AI,并且有医生持续地参与,在真实的应用场景中去支撑AI的持续成长。
一位医疗AI公司创始人对《财经》记者说,一些公司遇到技术迭代的瓶颈,卡住了,“干脆不继续推进,保持低投入、不推广,等着被收购”。
市场集中进程在快速完成,是接受《财经》记者采访的多位资本分析师都认同的医疗AI趋势。“谷歌、腾讯等巨头对初创企业甚至中型公司形成的压制会越来越明显,在接下来的一年,竞争会非常激烈。”王煜全分析称。
巨头的动作有迹可循。2017年8月才发布的腾讯觅影,后发制人地进入“国家队”,在科技部公布的“首批国家人工智能开放创新平台名单”中,明确“依靠腾讯公司建设医疗影像国家新一代人工智能开放创新平台”,从发布成立到进入“国家队”的这三个月里,腾讯觅影就与十多家三甲医院建立了联合实验室,筛查目标病种也从早期食管癌拓展到肺癌、乳腺癌等多病种。
巨头们从观望转变为全面投入,小公司们要不杀出一条血路,要不坐等被收购或挤死。“很多初创公司从创立之际就是坐等巨头开个好价的,‘大鱼吃小鱼’接下来会频繁发生。”尚鞅如此解读2018年的医疗AI市场。
另一方面,管理也随着市场发展开始“划车道”。2018年8月1日,新版《医疗器械分类目录》将开始实行,其中新增了与AI辅助诊断相对应的类别。
按照分类规定,申报二类医疗器械,诊断软件通过算法,提供诊断建议,仅有辅助诊断功能,可不直接给出诊断结论;如果对病变部位进行自动识别,并提供明确诊断提示,则按照第三类医疗器械管理。
医疗AI公司想走医院采购这条路,必须通过相应的认证。这就需要公司获得大量真实的临床应用数据,为申报提早准备。
多数医疗AI公司还处于打磨产品阶段,商业模式并不清晰,与医院的合作多为提供产品试用,收不到钱。阿里健康副总裁柯研告诉《财经》记者,现在市面上的很多AI公司单纯融资,无论估值多高,没有收入来源和场景,商业模式是断的,“再过三年没有商业模式,会走向边缘”。
在医疗人工智能领域,最核心的要素是场景。场景大于数据,数据大于算法。至于未来谁埋单,柯研说,“我们相信,只要有场景,最后一定会有人心甘情愿付这个钱。”
国内的医疗AI公司,主要与大城市的三甲医院合作,但优质医疗从业者密集的三甲医院,没有迫切需求。真正需要AI缓解的,是资源紧张的中小型医院,这部分市场潜力还远远没有开发出来。
放眼整个行业,一个逐渐清晰的场景就是,影像AI会率先支撑基层医疗。基层医院用影像AI筛查以后,发现一些有问题或者看不准的病例,再交由上级医院的医生来确诊。
再看远些,医疗AI技术如果能够突破应用关,将顶级医生的诊断能力标准化后,交给基层医院,为基层医生提供辅助诊断,会在很大程度上改善医疗资源的紧张状况。
麦肯锡全球研究所预测,大面积使用人工智能诊断疾病可能不会太快发生,即使早已入局的巨头们,也不过是入门级水平,这并不妨碍AI会成功渗入,成为医疗的底层技术,就像之前的IT技术一样。
人工智能和人类医生比谁更聪明,可能还会持续。《新英格兰医学杂志》认为,这种争论没有意义,如何让人工智能和人类医生一起,实现任何单一方都无法提供的临床效果,才是关键。
行业的狂欢和泡沫,是任何一个新技术浪潮的必经之路。最后胜出的,是那些创造了真实价值的技术和产品。
原文发布时间为:2018-03-7
本文作者:贺涛 刘浩南 张利
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号