昨日——也就是2020年的第一天,我们发表了文章《全球女性福音!DeepHealth深度学习模型检测乳腺癌完胜5名放射科医师》,在人工智能与医学界引起高度关注!今天——也就是2020年的第二天,另一家全球知名人工智能公司DeepMind(以AlphaGo击败世界围棋冠军而享誉全球!于2014年被Google收购)再传最新战果:他们在《Nature》上在线发表了题为《International evaluation of an AI system for breast cancer screening》的论文,将人工智能的最新应用引向新的历史阶段!
乳腺癌仍然是全球性挑战,是女性死于癌症的第二大主要原因,2018年在全球造成超过100万人死亡。但早期检测与治疗可以显著提高患者临床结局,因此全球卫生组织推荐行X线钼靶筛查(乳腺癌筛查的“金标准”)(在美国和英国,每年接受筛查的总数超过4200万次),据估计可将乳腺癌死亡率降低20-40%。
然而,显著的假阳性和假阴性率,以及高昂的解读成本(癌症检测专家之间的准确度也差异很大),使得临床仍需要质量更高、可及性更高的筛查手段(假阳性可能导致患者焦虑以及不必要的随访和侵入性诊断流程;而在筛查中遗漏的癌症,则可能要等到癌症发展到更晚期、更难以治疗时才会被发现)。
人工智能可能具备独特的能力来帮助应对这一挑战!在医学影像分析的好几个任务上,人工智能的性能已经达到或超过人类专家。由于钼靶影像专业人员的短缺威胁着全世界乳腺筛查服务的可用性和充分性,因此人工智能的可扩展性可以改善所有人获得高质量护理的机会。
在该项研究中,研究团队开发了一个人工智能系统,它能够在乳腺癌预测方面超越人类专家。为了评估人工智能系统在临床上的性能,研究团队收集了一个来自英国的具有代表性的大数据集和一个来自美国的内容丰富的大数据集。
本研究中AI系统的开发过程
研究结果显示,假阳性率绝对降低了5.7%(美国)和1.2%(英国),假阴性率绝对降低了9.4% (美国)和2.7% (英国)。而且,这个人工智能系统使用英国的人群数据集进行训练后能够对美国的人群数据进行分析和处理。
人工智能系统和临床读片医师在乳腺癌预测中的表现
在一项由6名放射科医师组成的独立研究中,该人工智能系统的性能优于所有人类读片者:人工智能系统的AUC-ROC面积比放射科医师的平均AUC-ROC绝对限度大11.5%。
研究团队对该人工智能系统还进行了英国的“双重阅读流程”(Double Reading Process)的模拟,发现该人工智能系统保持了非劣效性能,并使第二个读片者的工作量减少了88%。对人工智能系统的有力评估,为开展提高乳腺癌筛查的准确性和效能的临床试验铺平了道路。
在乳腺癌预测上,人工智能系统的性能与六名独立读片医师的对比
总结:
这项研究开发了一个新型的钼靶影像人工智能系统,可以对钼靶影像大数据进行分析和处理;该系统可大幅降低钼靶影像的假阳性与假阴性,而且完胜6名放射科医师。它既能保持优秀的性能,又能够降低劳动力的使用量。该系统可广泛应用于英国人群与美国人群,为开展提高乳腺癌筛查的准确性和效能的临床试验铺平了道路。