AI医疗开创性研究:深度学习进行病变检索和匹配(31 PPT)

简介: 美国国立卫生研究院(NIH)的研究人员通过创建基于真实放射学影像的大型数据集,进行病变检索和匹配的研究。本文是相关研究在约翰霍普金斯大学 Sol Goldman国际会议上的演讲整理,该研究具有创新性的科学价值和临床价值。

本文介绍了美国国立卫生研究院(NIH)最新的一篇CVPR论文“Deep Lesion Graphs in the Wild: Relationship Learning and Organization of Significant Radiology Image Findings in a Diverse Large-scale Lesion Database”(深度病变图:在不同的大规模病变数据库中,重要放射学图像发现的关系学习和组织),主要作者是闫柯和王潇崧等研究人员。

aaa5d97fcc78afbf23c9c21c6c9230aa1861422a

对于精准癌症影像诊断和治疗方案的选取,基于内容的retrieval和instance-level相似性的描述是很重要的。人类的癌症有很严重的长尾现象,并不是简单的分类或者regression; mapping X to Y就能很好解决,所以癌症的治疗和诊断本质上最重要的是个性化(personalization)。当有一个新的病人,医生最想知道的是在以前已经治疗过的病人里面有没有谁跟他是相似的。如果能够找出相似的病人,而且知道这些病人的治疗方案以及治疗结果,医生就可以更有针对性地来设计治疗方案。而且通过对相似病人的建模,可以知道每种治疗方案的风险性以及预后效果。

虽然每个大医院都存了上百万甚至上千万的病人数据,但是目前没有很好的办法来做相似性病人的检索。这篇文章的意义是以肿瘤图像(tumor image instance)为例子,打通了一个做这个方向的技术模型。该模型可以允许一个新的肿瘤图像在以前上万的肿瘤图像中检索相似的、而且又比较完整的tumor similarity graph,这对临床工作有很大的帮助。这方面的工作以前非常少,因此这篇文章是比较有前瞻意义的。

该研究的数据涉及4000多个病人的一万多个医学图像。既使在这个数据尺度下,因为计算能力的问题,人是很难做什么的。

计算医学本质上是为了去获取临床医生想要,需要但自己又没办法做到的东西。有的病人会问到大医生如果采取了A治疗方案,预后结果会怎么样,生存率有多高?现在都是基于经验去猜的,也不能定量的计算。这篇文章就是一个很好的例子,来逐步解决这个定量精准医疗的问题。相比之下,大家比较熟悉的肺节节检测问题,是属于另外一类的问题,本来就是医生也可以做,计算的目标是使用深度学习来做辅助诊断,主要以提高医生效率为目的。

这篇文章里面用到了32000多个医生测量过的significant clinical findings,,这些测量结果是放在医院PACS/RIS放射学数据库里面作为定量的references。我们的算法通过pair wise similarity graph可以针对图像分类,包括 intra-patient matching(在同一个病人的多次影像studies中,自动的把以前测量过的同一个肿瘤影像连起来);并且允许跨病人的、基于图像相似性的检索(inter-patient similarity retrieval)。

2e1f837e7a172374f830441c26c1e184e8822bad

背景

包含多样化的图像和密集注释的大规模数据集对于计算机视觉和医学图像研究都很重要

  • 众包模式可以用于注释计算机视觉数据集,但医学图像(MI)需要专业知识和培训

  • 通过Deep Learning挖掘互联网图像可用于计算机视觉以获取自动注释;

幸运的是,像计算机视觉中的网络数据一样,大量数据源以图像存档和通信系统(PACS / RIS)的形式存在。

那么,我们可以挖掘“非结构化但非常丰富的”PACS吗?

5fd85957883fe2a3383f5314cd7e99d9573ee109

放射科医师在日常工作中可能会定期对放射学影像的某些显著的异常或“病变”进行标记和测量

d47e62d2b349aca45e42305ed6714efbe5ed61d9 多年来收集并存储在医院的PACS / RIS中
d47e62d2b349aca45e42305ed6714efbe5ed61d9 有时被称为“bookmarks”

d47e62d2b349aca45e42305ed6714efbe5ed61d9用于评估患者的状况或治疗反应

c008dbdd9e3492cc75a202e239b54c0c07e6e69f

“DeepLesion”数据集:

d47e62d2b349aca45e42305ed6714efbe5ed61d9这些数据从NIH的PACS里的bookmarks挖掘而来

21f69d4392510b06692f05f0dad5df7d9ac62384

问题定义

d47e62d2b349aca45e42305ed6714efbe5ed61d9 DeepLesion中的病变基本未排序,并且缺乏语义标签,例如肺结节,纵隔淋巴结

我们的目标是:通过“自动Instance-level的相似性建模和拓扑发现挖掘”,了解和组织大量的病变或肿瘤学发现

1. 发现他们的类型和位置

2. 从不同患者群体中发现相似的病变,即基于内容的检索

3. 跟踪同一患者几次纵向研究中的相同病变,即多次研究中的病变实例匹配或追踪

4bb145241ee0ff2f745fd06bb865555dcfe0309e

相关工作:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 病变检索

d47e62d2b349aca45e42305ed6714efbe5ed61d9病变匹配

748d9b7c0c25b9f7856a5dfd001a30dbec2a1e88

监督提示(I):病变类型

d47e62d2b349aca45e42305ed6714efbe5ed61d9 我们随机选择30%病灶并手动标记为8种类型:肺,腹部,纵隔,肝,骨盆,软组织,肾和骨

d47e62d2b349aca45e42305ed6714efbe5ed61d9病变的粗糙属性

c7be8ef6dfca1290c1478821821668b442cf6952

监督提示(II):相对身体位置

d47e62d2b349aca45e42305ed6714efbe5ed61d9 在DeepLesion中,某些CT体积放在身体的一部分上,例如仅显示左半身

d47e62d2b349aca45e42305ed6714efbe5ed61d9SSBR在罕见的身体部位表现不佳,这些部位在训练组中的频率较低,例如头部和腿部

0eec779ec025e45bce691792d40177930aa1fda2

监督提示(III):病灶大小

d47e62d2b349aca45e42305ed6714efbe5ed61d9 病变直径的长轴和短轴的长度
d47e62d2b349aca45e42305ed6714efbe5ed61d9 已由放射科医师进行注释和测量

d47e62d2b349aca45e42305ed6714efbe5ed61d9范围从0.2到343毫米,中位数为15.6毫米

12aae4fdabf527f96910cf3a0a3a2486589eec25

使用顺序采样构建Triplet Network

d23d9b9cc069b7c72b8ada774c1a11c57bf2cbf4

图3第4行有标签噪声,病变D与A~C(软组织与骨盆)的类型不同,

5ec4610622bd97caa8cd143ffdc59248b9cbe78d

网络架构

d47e62d2b349aca45e42305ed6714efbe5ed61d9 主干:VGG-16
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Multi-scale, multi-crop

d47e62d2b349aca45e42305ed6714efbe5ed61d9输出:对于每个病变实例,输出是一个1408D特征嵌入向量

db4e5f80f439211a101524c6b0ea1efa4a03d42a

病变组织:检索和匹配

d47e62d2b349aca45e42305ed6714efbe5ed61d9 基于内容的Inter-patient的检索:找到最近邻

d47e62d2b349aca45e42305ed6714efbe5ed61d9Intra-patient 的病变匹配:基于图形的edge pruning

0563408ac1420c79bc1621eb54b30207e3ccb8bc

实现细节:图像预处理

01e35f9bf554cbef962b61a9d73f335eb45e1ac8

实现细节:训练计划

d47e62d2b349aca45e42305ed6714efbe5ed61d9 位置和大小的每个维度的最大值归一化为1
d47e62d2b349aca45e42305ed6714efbe5ed61d9 每个mini-batch 24个five-instance序列
d47e62d2b349aca45e42305ed6714efbe5ed61d9 学习率为0.002的SGD

d47e62d2b349aca45e42305ed6714efbe5ed61d9为了训练SSBR,我们使用了来自DeepLesion的420名受试者的800个随机未标记的CT volumes

e9b5f662ccfa1745c8007a5931883eceb755a268

实验

d47e62d2b349aca45e42305ed6714efbe5ed61d9 DeepLesion的可视化:将病灶密集连接的超图投影到2D图(t-SNE)中

d47e62d2b349aca45e42305ed6714efbe5ed61d9散点图的X轴和Y轴对应于每个病变相对身体位置的X和Z坐标

cb334eb2d78bea0de2933501c696ac6f599b82d7

实验:病变检索

d47e62d2b349aca45e42305ed6714efbe5ed61d9多尺度的深部病变外观矢量,通过Triplet Network对病灶类型、位置和大小进行编码

0d785a2a653404f386161a2d8c8b068464edd770

分析和发现

d47e62d2b349aca45e42305ed6714efbe5ed61d9 当位置和大小作为监督提示时,网络在病变类型检索方面表现最佳; 甚至比只使用病变类型作为提示时更好。
d47e62d2b349aca45e42305ed6714efbe5ed61d9 位置和大小提供了学习病变相似性嵌入的重要补充信息
d47e62d2b349aca45e42305ed6714efbe5ed61d9 仅使用 coarse-scale 特征(conv5,conv4)时, location稍好,因为location主要依赖更高级的上下文信息
d47e62d2b349aca45e42305ed6714efbe5ed61d9 融合 fine-level特征(conv3,conv2)可显着提高类型和大小预测的准确性

d47e62d2b349aca45e42305ed6714efbe5ed61d9迭代病灶特征/类型细化也有帮助!

842334c14c5b9c9caf6bbbf829f1cdc21b6a1827

实验:分类

最容易混淆的类型是纵隔/肺部病变,以及腹部/肝脏/肾脏病变,因为其中一些在外观和位置上都相似。

ca412466ee6348f8e8314f8813fed0736f5141c2

实验:病变匹配

d47e62d2b349aca45e42305ed6714efbe5ed61d9 将DeepLesion中的103名患者的1313个病变手动分成593个组进行评估
d47e62d2b349aca45e42305ed6714efbe5ed61d9 每组1-11个病变
d47e62d2b349aca45e42305ed6714efbe5ed61d9 true positive decision将同一实例的两个病变分配给同一组, false positive decision将两个不同实例的病变分配给同一组

定量病变匹配的精度非常高!

bfb3799776b0685b3267e006906dbcd4d3f06997

纵向病变匹配

83bcb5893fb65140fa22d06bc900916906634047

结论

我们提供了一个大型、全面的数据集DeepLesion,其中包括从PACS挖掘的重要放射影像的findings

可用于多种类别的病变检测,检索,分类,分割......,这是开创性的研究

利用一个triplet network学习Lesion Graph Embedding,以对类型、位置和大小的相似关系进行建模

  • 所需的唯一手动工作是某些种子图像的类别标签

  • 非参数的深度放射学实例/知识表示

结果:(a)基于内容的inter-patient病变检索和(b) intra-patient的定性和定量的病变匹配


原文发布时间为:2018-04-28

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:AI医疗开创性研究:深度学习进行病变检索和匹配(31 PPT)

相关文章
|
3天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
34 8
|
11天前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第17天】北京大学计算机学院张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可能导致误诊和医疗事故,引起学术界和工业界的广泛关注。研究强调了医疗AI系统安全性评估的重要性。
27 1
|
1天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
86 59
|
2天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗领域的革命:智能诊断系统的未来
在科技日新月异的今天,人工智能(AI)技术正逐渐渗透到我们生活的每一个角落,其中医疗领域尤为显著。本文将探讨AI在医疗诊断中的应用及其带来的变革,重点介绍智能诊断系统的发展现状与未来趋势。通过深入浅出的方式,我们将揭示AI如何改变传统医疗模式,提高诊断效率和准确性,最终造福广大患者。
|
2天前
|
机器学习/深度学习 人工智能 算法
AI在医疗:深度学习在医学影像诊断中的最新进展
【10月更文挑战第27天】本文探讨了深度学习技术在医学影像诊断中的最新进展,特别是在卷积神经网络(CNN)的应用。文章介绍了深度学习在识别肿瘤、病变等方面的优势,并提供了一个简单的Python代码示例,展示如何准备医学影像数据集。同时强调了数据隐私和伦理的重要性,展望了AI在医疗领域的未来前景。
13 2
|
6天前
|
机器学习/深度学习 人工智能 供应链
AI技术在医疗领域的应用与未来展望###
本文深入探讨了人工智能(AI)技术在医疗领域的多种应用及其带来的革命性变化,从疾病诊断、治疗方案优化到患者管理等方面进行了详细阐述。通过具体案例和数据分析,展示了AI如何提高医疗服务效率、降低成本并改善患者体验。同时,文章也讨论了AI技术在医疗领域面临的挑战和未来发展趋势,为行业从业者和研究人员提供参考。 ###
|
7天前
|
机器学习/深度学习 人工智能 搜索推荐
人工智能与未来医疗:AI技术如何重塑医疗健康领域###
【10月更文挑战第21天】 一场由AI驱动的医疗革命正在悄然发生,它以前所未有的速度和深度改变着我们对于疾病预防、诊断、治疗及健康管理的认知。本文探讨了AI在医疗领域的多维度应用,包括精准医疗、药物研发加速、远程医疗普及以及患者个性化治疗体验的提升,揭示了这场技术变革背后的深远意义与挑战。 ###
32 6
|
7天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗领域的应用与挑战
【10月更文挑战第21天】 本文探讨了人工智能(AI)在医疗领域的多种应用,包括疾病诊断、治疗方案推荐、药物研发和患者管理等。通过分析这些应用案例,我们可以看到AI技术如何提高医疗服务的效率和准确性。然而,AI在医疗领域的广泛应用也面临诸多挑战,如数据隐私保护、算法透明度和伦理问题。本文旨在为读者提供一个全面的视角,了解AI技术在医疗领域的潜力和面临的困难。
|
13天前
|
人工智能 安全 搜索推荐
北大计算机学院再登国际AI顶刊!张铭教授团队揭露医疗AI致命漏洞
【10月更文挑战第16天】北京大学张铭教授团队在国际顶级人工智能期刊上发表重要成果,揭示了医疗AI系统中的致命漏洞——“模型反演”。该漏洞可使攻击者通过特定数据样本误导AI诊断,引发误诊风险。此发现引起广泛关注,强调了医疗AI安全评估的重要性。
31 4
|
15天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗领域的革命性应用
【10月更文挑战第14天】 本文探讨了人工智能(AI)在医疗行业中的多种应用,包括疾病诊断、个性化治疗、药物研发等。通过具体案例分析,展示了AI技术如何提高医疗服务效率和准确性,同时指出了当前面临的挑战与未来发展趋势。
34 2