4.1数据层面的局限性
AI医疗当下所面临的最大困难来自于整合不同来源的数据。首先,我国缺乏数据安全相关的执法落地实践。这需要尽快配套落实相关的数据安全标准和指南以及有关医疗大数据的行业相关条例,以规范医疗数据的法律监管现状。政府部门需要考虑相关立法,企业本身也应当强化数据保护意识,建立企业内部规范和技术标注。如今医疗行业数据正以惊人的速度激增,其法律监管需要引起行业的高度重视。中国科学院院士、阜外医院副院长顾东风表示,国家在搭建统一大健康大数据医疗平台过程中,已在初步拟定通用统一大平台标准。同时,应用在推广大数据时应该隐去个人特征,例如姓名、住址等信息。
其次,由于不同来源的数据其质量、格式与诊断意见都各不相同,很难实现数据的有机链接与解读。尽管中国医疗数据量巨大,可开拓的空间非常广阔,但是高质量的数据却并不多。即使医院有数万病例,但如果根据不同的病症、检查方式及研究目的进行区分后,数据量就会变得很少。而且在诊断某一病症时,并不能够仅依靠某一项的单一数据,而是需要结合病人其他信息,例如实验室检测和病理标本等。这些基因和病理数据在获取时难度很大且花费巨大,在与算法结合时将增加额外的难度。尤其当面对患病人群数量小的罕见病群体时,可以提供给AI建立模型的有效数据非常少。
除了数据量不均衡以及数据标准化不足之外,不规范的标注也是提升AI模型质量的一大障碍。医疗图像识别是人工智能在医疗行业的一大重点应用,分别有分类、检测和分割三种方法。它们都需要准确且全面的标注,否则会造成数据污染,影响模型效果。
4.2技术层面的局限性
从技术层面来看,目前AI的发展仍处于早期,即计算智能。尽管感知层面的技术有一定的进步,但认知层面的技术发展仍处于非常早期的阶段。而且几乎所有人工智能的最新进展都是通过监督式学习来完成的,即:输入数据到快速生成简单的回应。深度学习就是监督式学习中重要的方法,但其与有高度认知能力的人工智能还有很大差距。这种监督学习框架的致命弱点在于需要海量的经过标注的数据。就现状来说,非监督式学习理论仍不成熟,这导致其应用仍然存在很大的局限性。
可以想象,在一个普通的就医场景下,如果将医生与患者交互中的信息量换成AI算法识别的某几个指标,则会无形中丢失许多信息,并且对最终的诊断产生一定影响。因为患者与医生之间的交流存在复杂的前反馈,尽管已经通过文献或教材建立了相关病种的知识库,也仍缺少一个专业医生的常识库。而且当下的算法只能够通过学习诊断出已知的病症,却对疑难杂症一无所知。除了常识不足,相较于一个专业医生,人工智能技术并不能提供医患之间的情感交流,这种“糖丸效应”在实际就医中起到了非常积极的作用。同时,一个经验丰富的医生在进行诊断时,不仅会参考患者客观的病理情况,也会在交流过程中评估对方的心理及精神状态,帮助诊断其病情。但当今的人工智能技术尚未能够在感性智能上有所突破。
4.3市场及政策层面的局限性
据了解,如今人工智能医疗行业发展形式大好,但在国内审批及认证方面仍处于一个打磨的阶段。与美国FDA审批的医疗AI产品大多为二类医疗器械相比,国内目前是将新一代医疗AI定位为三类医疗器械,即高风险设备。所以产品基本上是必须通过临床试验的,并且临床评价的路径将控制得十分严格。
即便顺利通过了临床试验,如今用于审批的标准数据库也还在建设中。因为医疗AI产品的普遍适应性必须通过建立标准测试数据库来进行考核,从而确保模型可以在不同等级的医院环境下正常使用。
建立这个数据库要遵循广泛性、兼容性以及医学图像标记的标准性。广泛性要求数据来自不同城市的医院;兼容性要求有不同类别的图像,例如不同层厚的CT图像;医学图像标记的标准性则依靠招募有医疗AI研究背景的医生,并按统一标准的标注方案对医生进行培训,再进行标注。中国食品药品检定研究院官方微信发布的信息显示,2018年3月26日,标准测试数据集(眼底部分)建设完成,肺结节的标准数据库建设方案也已经定稿,近期即可建设完成。
当医疗AI企业顺利通过审批后,AI产品的性能、模型以及应用界面仍将不断快速迭代,那么传统的升级审批流程速度是无法满足产品的迭代需求和行业的发展速度的。据了解,在传统的审批流程下,医疗影像AI产品迭代周期是3-5天。如果每周都需要去报备更改,对于企业和政府部门都是重大的负担。