从英特尔支持DE超声机器人开发，看人工智能在医疗影像领域的价值和机遇-阿里云开发者社区

医疗影像数据快速增长，引入人工智能技术成必然

人工智能和医疗影像的结合已经成为一个比较热门的研究和创业方向。除了以深度学习技术驱动的计算机图像识别能力的大幅提升之外，医疗影像数据的快速增长也是重要原因。

医疗大数据中有超过 80 % 的数据来自于医疗影像。这些数据大多要进行人工分析。目前我国医学影像数据的年增长率约为30%，而放射科医师数量的年增长率约为 6.1%，其间的差距是 23.9%，放射科医师的数量增长远不及影像数据的增长。这意味着放射科医师在未来处理影像数据的压力会越来越大，甚至远远超过负荷。

同时，医疗影像的多样性也在不断增强，已经从常见的以灰度为主的 X 光片、CT、 MRI、B 超等发展到结合了其他动力学、医学解剖学等特征的计算机合成的彩色、多维影像图片，以及各种数字检查镜产生高分辨率图像，如眼底照片、病理图像等等，以及在影像以外再加上治疗数据、基因数据、预后数据以及影像时间维度的扩充等结合，多模态影像、病理、检验、基因及随访信息等数据的种类繁多。

然而长期以来，人工鉴别图像几乎是医疗机构唯一在使用的方式，对医师的经验、状态都有着极大的依赖，加之人眼的分辨率和敏感度限制，客观上制约了对影像资料的充分利用。影像科医师较长的培养周期，也对基层医疗机构承担起分级诊疗政策指导下的疾病初诊都造成了一定压力。

当然，也要看到，尽管数据量如此巨大，且多样性极强，但因为医疗影像数据的标准化、结构化和统一性在整个医疗数据中仍然是最强的，再加之以深度学习技术驱动的图像识别本就处在这一波 AI 技术应用浪潮的最前沿，这使得医疗影像智能分析在智能医疗各领域中都属于发展较快的一支。国内外涌现了一批将 AI 技术应用于医疗影像识别和分析的初创公司。然而，在具体的技术落地过程中，这些公司往往会遇到一些特定的难题。

在此，我们和大家分享一个在英特尔技术支持下，由浙江大学数理学院和浙江德尚韵兴图像科技有限公司成功开发的智能医疗影像诊断系统的案例。该系统的任务是识别和分析影像中的甲状腺结节以及良恶性。根据实测，国内比较顶级的三甲医院 10 年资质的放射科医生判断准确性平均在 75% 左右，而目前双方合作开发出的系统-DE 超声机器人的准确率则能稳定在 85% 以上，在实验室则达到 90% 以上。并在包括浙江大学第一附属医院的医疗机构已经实际应用，服务了几千名患甲状腺结节的病人。

DE 超声机器人的用途、优势和价值

浙江大学数理学院和德尚韵兴公司的联合开发团队针对目前人群中高发的甲状腺结节的智能读片和分析需求，研发了基于深度卷积网络 DNN 的算法，可对超声医学图像病变区域进行识别和判断。深度学习可以模仿人脑的机制来提取医学影像的特征，形成更加抽象的高层特征来进行分类或识别物体。传统的机器学习方法是由专业人员来定义结节或肿瘤的特征，如钙化、边缘、毛刺、灰度等，利用特征组合来表示目标属性或类别。由于影响因素十分复杂，人工定义特征难度高而且效果也比较有限。深度学习能自动学习具有层次结构的特征，如浅层次特征:边缘、灰度、角、回声、钙化、形状等; 深层次特征:复杂纹理。通过特征学习准确的实现对目标的识别和分类。同时，结合分割技术、检测与识别技术，通过来自大量不同医院、不同品牌、不同型号的超声机采集的超声影像数据来训练网络结构，开发出了超声医学影像智能诊断系统——DE 超声机器人。

功能说明：

功能一:甲状腺结节探测与识别

无需医生干预，便可从原始的甲状腺超声图片中快速地勾画出所有结节的轮廓。

功能二:甲状腺结节良、恶性诊断

对超声图片中每个结节分别自动、快速地诊断其良、恶性。

为了更好的验证 DE 超声机器人对医生诊断的支持效果，研究团队与某国内排名前十的三甲医院超声科进行了读片对比，分别遴选出十年资和两年资以上的超声医生与DE 超声机器人的读片结果进行比对，以病理报告的结果(金标准)为依据。竞赛结果表明，资深超声医生的识别准确率平均约为75%，而超声机器人则稳定在 85% 以上。

开发过程中的挑战，及基于英特尔领先AI技术的解决方案

在研发过程中，研发团队遇到了如下挑战：

1. 原有训练平台使用了 GPGPU 产品，片上内存仅有 8GB，而每次训练需要导入内存的数据超过 12GB，经过大量重新设计网络、优化计算框架、压缩数据集等方法，将内存需求降低到 6GB，但是最终的效果受到了影响。

2. 最初设计了工作站和云版两种部署模式，并实现了工作站平台版本，但未能应用 MKL 加速，单张影像分析时间较长，为后续处理连续 B 超影像带来性能瓶颈。云版需要考虑多用户管理并且在结合医疗机构正常甲状腺管理方面做好整合，工作量较大一直没有开始。

3. 在甲状腺 B 超取得显著进展的同时，也开始了乳腺癌、腹部 B 超、颈动脉斑块等其他方向的研究，原平台最多 4 卡限制了研究效率。

英特尔与浙江大学数理学院、德尚韵兴公司一起实现了以下重要进展：

1. 共同将模型训练从 GPU 四卡系统迁移至 Intel Xeon Phi 7250 四节点平台，经过优化单节点性能约为元平台处理速度的1.1 倍。

2. 共同将预测模型用英特尔的 MKL2017 优化，在 CPU 平台的评分速度预计获得 8X 以上提升。

3. 共同改进算法准确度，进一步提高图像识别的精度。

4. 引入英特尔医疗生态链合作伙伴经纶世纪，共同将基于单机的 DE 诊断系统升级为云服务方案，并部署在阿里云平台，支持在浙大医院超声科的实时业务。

5. 与经纶世纪依照美国甲状腺协会指南的甲状腺风险度评估与管理系统集成，并成功推广到面向 2000 万人口的中国健康促进基金会全国筛查项目。

英特尔人工智能系统化解决方案

图四:深度学习步骤示意图

英特尔秉承人工智能大众化的理念，致力于不断推出易于部署和开发，高效能的深度学习平台。英特尔的深度学习体系分别对针对训练和评测两个环节进行了优化，共享共同的基础架构和开发环境，使得开发、维护、代码复用等大大简化。

图五:英特尔深度学习系统化解决方案

英特尔深度学习训练服务器

英特尔的深度学习平台可以基于 Xeon 或者 Xeon Phi 众核处理器来构建。其内置了诸多模块，使开发者进行机器学习开发更加容易。英特尔开发了深度学习加速函数加强它广泛应用的 MKL (Math KernelLibrary)数学库，并通过 DAAL (Data Analytics Acceleration Library) 数据分析加速函数库提供分布式机器学习功能，它对基于 IA 的硬件平台进行了深度优化。这两个库都可以通过“社区许可”免费获得。

英特尔还提供了基于 Intel Xeon 处理器和 Intel Xeon Phi 处理器的 Caffe，Theano，Tensorflow 等深度学习主流框架的优化整合包(Caffe Optimized Integration for Intel Xeon 和 Intel Xeon Phi)。英特尔全路径架构(Intel OPA，Intel Omni-Path Architecture)和 Xeon Phi Knights Landing 处理器支持超高速互联计算节点集群。新的智能方法，可以将深度神经网络训练扩展到大量处理节点上，从而在目前最优的基础上显著减少了训练时间。例如，使OverFeat-FAST 深度神经网络拓扑结构，已经有研究机构在目前 64 个节点的 Intel Xeon E5-2697 处理器上将训练时间降低到了 8 小时，使用Knights Landing 平台会将时间降低到 3-4 个小时。

基于 Xeon Phi 众核处理器的训练服务器可以克服片上内存对计算规模和网络深度的限制，并且作为自启动处理器，可以直接访问主存，显著提高计算效率。当搭建大规模的训练集群时，128个节点的 Xeon Phi 可以达到 50倍以上的速度提升。

浙大数理学院最早选择了 ConvNet 在 GPU 平台上进行模型训练，因为大量 B 超影像的数据对内存要求较高，他们在 ConvNet 上做了深入优化和压缩使对内存的占用从 12G 降低到 6G，使得算法得以运行完成，但是对精确度和计算效率都造成了一定的影响。转入 Xeon Phi 平台后，内存的限制被移除，除了处理器带有高达 16G 的片上内存，单个节点可直接访问的主存空间也高达 384G。

研究团队采用了如下配置的 Xeon Phi 的训练服务器：

在单个节点 Xeon Phi 平台使用 IntelCaffe 以及 MKL2017 的最新版本，经过调优后，速度提高到2 倍，在 ResNet101 和 ResNet50 的测试中，甚至达到对比组 M40 的性能的 1.2 倍。

英特尔人工智能评分系统加速方案

浙江大学数理学院和德尚韵兴公司的联合开发团队初期为了将在GPGPU 上训练好的模型部署于工作站或者云端，基本上重新编写了全部实现代码，并且进行了深度优化，单幅图像的处理时间一直在30 秒左右。这在开始阶段可以接受，但是 B 超本身产生的是连续图像，这使得连续处理时间几十倍的增加，并且增加了其他病种后时间会变得更长，产品化和商业化的时间都受到影响。

联合开发团队装了数学核心库的最新优化版本 MKL2017 以后，打开并行化选项，在不改变代码的情况下就已经获得 2 倍以上的速度提升，经过深度优化，速度提高到 10 倍左右。这些优化由于得到基于统一的 IA 架构的支持，无论是在工作站方案，还是云版方案，都同样得到了效能的显著提升。

与此同时，云服务商将 MKL 部署于其计算环境，即可对其客户的应用进行加速。

“只要是计算，英特尔就是最好的”。英特尔医疗与生命科学集团亚太总经理李亚东如是说。

与生态系统合作伙伴一起发挥 DE 超声机器人的应用价值

英特尔积极联合生态环境产业合作伙伴，推动人工智能研发成果产品化，探索有效的业务模式，为行业提供从方案架构到业务流程的参考案例。

在浙大医学院附属第一医院超声科的部署，得到了几位主任的高度评价与支持。超声机器人作为初步的筛查工具，可以避免医生花费大量时间查看比较简单的图像，集中精力于复杂案例，也可以有效的降低漏诊、误诊等问题。蒋主任介绍说，超声科的医生工作负担非常重，每天可能要书写数百份超声报告，很多虽然基本但是很耗费时间，经过长时间的工作，医生的准确率可能会受到影响。引入超声机器人作为助手，医生只需要复核，经过标注的可疑区域也非常直观，提高了效率，作为培养年轻医师的手段也很受欢迎。

位于杭州的另外两所社区卫生院基于阿里云部署的超声机器人，也深受当地医生患者好评。之前由于基层的医生经验有限，很难及时给出报告，现在只需要数秒，超声机器人就可以自动生成一份详细的参考报告模板。既可以全自动地探测结节区域、识别结节的良恶性，也可以通过人工勾画出结节区域，然后系统自动识别其良恶性。

英特尔与医疗机构一起推进先进技术在的普及和应用，惠及更大量人群，参与到中国健康促进基金会的全国甲状腺结节检查与风险度评估项目，并与执行单位经纶世纪一起与超声机器人紧密集成，并利用阿里云的覆盖网络和在线存储服务，将业务应用推广到数百家体检中心，将会覆盖每年参检的 2000 多万人群。

在以往人工智能在线服务模式中，作为服务提供方的机构往往会遇到云服务公司的平台对人工智能算法的支持较弱，关键算法需要重新设计，加速卡等方案昂贵而且由于云服务公司的平台管理机制无法使用，造成无论是在线性能、优化、维护成本都不够理想。

阿里云将对人工智能应用的平台化支持作为重要的建设目标，与英特尔紧密合作，从通用计算硬件(Xeon，Xeon Phi 等)选型到计算加速库、大数据分析加速工具的整合与优化做了大量工作，并且通过一系列安全强化措施增强了用户对数据上云的信心。最终线上版本的计算效能较为理想，直接将在本地优化好的应用迁移到云的过程很平滑，最终用户(超声科医生)的反馈也对响应和计算速度满意。在 2000 万人群的全国筛查项目中，集中体检对线上平台的压力较大，高峰时期可以达到 300-500 例并发在线评分诊断，而响应时间并没有显著延长。

英特尔与合作伙伴在人工智能在医学影像的开发和应用的探索实践，为将来引入更多病种的检测与诊断，充分发挥人工智能在影像识别的独特优势，提高诊断的质量和效率，起到了非常有效的推动。而英特尔系统化的计算硬件和所支持的丰富的计算结构和框架，则为开发者快速开发提供了有力武器，并且与其生态环境合作伙伴密切配合，为技术的普及和业务模式的发展提供了强力支持。

文章转自新智元公众号，原文链接

从英特尔支持DE超声机器人开发，看人工智能在医疗影像领域的价值和机遇

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件