10月25日,在加州山景城举办的ACMMM 2017大会进入正会第二天。在会上,HTC Healthcare 总裁张智威(Edward Y. Chang)博士进行了题为《DeepQ: Advancing Healthcare Through AI and VR》的演讲。在演讲中,张智威博士介绍了AI与VR等技术在医疗行业的应用,以及HTC在这一领域的一些研究。
关于张智威博士:张智威博士于1999年获得斯坦福大学电机工程博士学位,与Google创始人Larry Page和Sergey Brin系出同门,均出自于同一个实验室Stanford InfoLab(雷锋网按:在InfoLab校友名单中可查到)。在98年Google刚创立的时候,Larry和Sergey曾一再邀请张智威加入,而张智威毕业后选择了学术道路受聘UC Santa Babara分校,2006年加入Google,随后担任Google中国研究院院长,负责搜索 、社区、移动和 Big Data 研发。
演讲内容雷锋网整理如下:
AI等创新技术推动医疗行业颠覆性创新
医疗领域的进展往往受到三个因素的影响:成本、品质和普及的程度。这三个因素相互影响:如果降低成本,品质也会降低;如果提高品质,可能会造成成本的提升和普及率的降低。
无论是发达国家还是非洲等发展中国家都存在着这三方面不同程度的医疗问题。而AI、移动设备和移动传感器等技术的进展,有望为医疗行业带来颠覆性的创新,这也是HTC在进行探索的方向。
尽管如此,在技术上还是面临着很大的挑战。
例如我们都知道,AlphaGo虽然能在围棋比赛中战胜世界冠军,但如果拿AlphaGo下棋和用AI诊断病人病情来比较,会有以下不同:
AlphaGo的每一步动作是离散的和可穷举的,而病情检测系统包含无数连续的属性;
AlphaGo的输出结果是二进制的1和0(赢和输),而病情检测系统输出结果可能是800多种疾病中的某一种;
AlphaGo可以通过探索学习(自我对弈),而病情检测系统无法获得这样的数据。
在利用AI进行医疗诊断方面,HTC健康事业部(DeepQ)的解决方案是:先与医生进行合作,采用渐进的机器学习方法,让主Agent去选择部件Agent去探查病人的病状。
上图即为HTC的疾病检测仪,包含一个手机和各种传感器,并借助AI技术,能诊断中耳炎、黑色素瘤、尿肝病、肺炎、高血压等15种疾病。
在迁移学习上的尝试
以检测中耳炎为例,我们需要对图像进行分析,把正常的图像和中耳炎的图像喂给深度神经网络。但问题是在医疗领域往往没有那么多的数据,我们通过台湾的医院收集到了收集到1000个患者的数据,对于机器学习依然很少。
而另一个问题是,深度学习网络能达到75%准确率,而专家诊断的准确率在85%以上。我们在请教医生后准确率上升到80.11%,但这依然不够。怎么办呢?我们开始尝试用ImageNet的数据做迁移学习(Transfer Learning),但这可能也有问题,因为ImageNet上的分类都是猫猫狗狗之类的,并没有疾病方面的分类图像。
(通过迁移学习,准确率从80.11%上升到了90.96%)
但我们发现,通过CNN模型,可以将原图片和编码和还原处理后的图片进行比对。向神经网络输入一张图片,神经网络会将其进行编码和识别,然后激活相应的神经元得出识别的结果。例如有的中耳炎图片识别出来所激活的神经元是红色的甲虫,或者是海螺、拿铁咖啡等。这虽然没有识别出中耳炎,但识别出甲虫或者咖啡,这可能说明患者存在病变现象。通过建立这样的对应关系,可以将很多与中耳炎不相关的数据拿来进行训练,最后我们的准确率达到了90.96%。
另一个例子是,要诊断心率不齐必须看心电图,但由于FDA的限制,我们无法获取有效的数据。目前这方面能用的数据集只有两个,加起来只有300来个病历的数据,因此我们也在考虑,能否用语音方面的学习的成果迁移到心电图来(雷锋网(公众号:雷锋网)按:二者都是对波形进行分析学习)。目前我们还没有得到突破性的结果,但这应该是一个思路。
其他研究
我们在做的一个研究是,如何用最少的问题尽可能了解病人的病情,然后帮助医生更准确判断症状。这当中就是询问的问题的数量和诊断准确度的一个均衡,我们目前可以对100多种常见疾病50%的准确率,平均询问的问题为7.62个。
AI可以帮助我们实现更精准的医疗,而这需要收集更多的特征数据。下面这张图里列出了医疗数据可能的情况,这些数据可能是结构化、半结构化或者非结构化的,可能来自于医院、保险公司、社交媒体等。
我们在医疗大数据挖掘方面做了很多的工作。基于大数据,每个人的治疗方法、用量都会不一样。
精准医疗的另一个研究方向是精准手术。我们通过与VR设备结合,可以帮助医生更好了解患者诸如肿瘤位置、神经元分布等信息,帮助医生更好地进行决策。在如心、脑、脊椎等及精密手术中,VR/AR与AI或者与如达芬奇手术机器人的结合都有着很大的机会。
(例如在这个例子中,粉红色部分为肿瘤,如果从右上方进行手术,则可能会切掉蓝色部分的神经元)
在HTC DeepQ AI平台上,我们有三板斧:对数据的挖掘主要使用频繁项目集挖掘以及谱聚类,分类与回归中主要使用LDA、支持向量机和深度学习,以及迁移学习。
以上介绍的只是DeepQ平台的冰山一角。智能医疗中蕴含着更多未发现的机会,等待我们去进一步挖掘。