CVPR oral解读:医疗AI最新进展,可媲美人类医师推理能力的图像检测算法

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: 疫情让大众更加关注医疗健康。而在刚刚过去的CVPR2020中,也有很多医学方面的研究工作。深睿医疗就有四篇论文入选,其中三篇为oral,其论文涵盖了医疗图像识别,姿态估计等多个主题,在医疗AI方面取得了优异的成绩。

微信图片_20220109113924.jpg


CVPR竞争一年比一年更激烈。


从公布的论文接收结果来看,在5865篇有效投稿中有1467篇论文被接收,接收率仅为25%,oral按照往年经验,一般只有5-7%,竞争越发激烈。 


由于疫情,医疗行业的计算机视觉今年也备受关注,无论是oral,poster,还是tutorial,workshop,都有不少医疗健康领域的科研成果。 


其中,深睿医疗就有四篇科技论文入选,三篇选为oral,确实获得了一个相当不错的成绩。 


基于二部图的图像检测算法,拥有了媲美人类医师的推理能力


乳腺癌已成为当前社会的重大公共卫生问题之一,因此乳房X光照片质量检测具有重要的临床意义。


来自轴斜位视图(即中外侧斜肌和颅尾骨)的信息和乳腺疾病是高度相关的,有助于医生做出全面的决策。 


放射科医师能够在横断面图像识别出肿块,但是大多数现有的图像识别方法缺乏领域知识的指导,推理能力很差,因此会限制其性能。 


下面这篇论文介绍了一种先进的二部图卷积网络,使算法具备了类似放射线医师的轴斜位视图推理能力。    


 微信图片_20220109113926.png


我们来看一下二部图网络是如何实现推理能力增强的。  


 微信图片_20220109113929.png      


二部图将跨视图主干特征作为输入,并输出增强的特征以进行进一步的预测。首先,通过用伪标记映射空间视觉特征来构造二部图节点。每个映射单元是每个图形节点的代表区域。


然后,二分图边缘学习对几何约束和语义相似性进行建模。


接下来,通过在二部图中传播信息来进行对应推理以增强特征。最后,增强的特征将与原始信息聚合在一起,进行进一步的预测。 在DDSM数据集上的实验结果表明,该算法达到了最先进的性能。


此外,视觉分析表明该模型具有明确的物理意义,有助于放射科医生进行临床解释。 


同现有的方法相比,同等假阳性下检出敏感性高出4个百分点,同等敏感性下假阳性减少了近60%,充分验证了算法的有效性。


这篇文章也被选为2020年CVPR的ORAL,该算法也已经应用到深睿医疗的乳腺钼靶AI医学辅助诊断系统,用于乳腺疾病的早期筛查。 

病例文本数据及影像数据的关联挖掘全搞定:基于自然语言处理的图像识别


图像识别依旧是今年CVPR的大热方向,接受论文比例是各个主题中最高的。


《Graph-Structured Referring Expression Reasoning in The Wild》(图形结构的引用表达式推理)是由深睿研究员和香港大学计算机科学系联合发表的,主要讨论了一种基于自然语言处理的图像识别方法      


微信图片_20220109113930.png      


这种方法利用自然语言描述来定位图像上的目标物体。作者提出了场景图引导的模块网络(SGMN),该网络在表达式的语言结构的指导下,通过神经模块网络对图像语义图和语言场景图进行推理。 


此外,作者还提出了Ref-Reasoning——用于结构化指称表达式推理的大规模真实数据集。该数据集包含真实图像和具有不同推理布局的语义丰富的表达式。 


参考集包含83,989张图像中的791,956个参考表达。它具有721,164、36,183和34,609个表达参考对,分别用于训练,验证和测试。


RefReasoning包含许多语义丰富的表达式,这些表达式描述了不同的对象,属性,直接关系和间接关系。 


实验结果表明,SGMN在新的Ref-Reasoning数据集上明显优于现有的最新算法,并在常用的基准数据集上超过了最新的结构化方法。 这项技术在医疗场景下发挥了巨大的作用,可以用于病例文本数据及影像数据的关联挖掘。 


Deep Snake:实时实例分割算法识别物体轮廓


深睿研究院的另一篇论文:《Deep Snake for Real-Time Instance Segmentation》(Deep Snake实时实例分割算法)是与浙江大学计算机学院合作发表的。


Deep Snake用深度学习的方式实现了传统的主动轮廓模型思想,使用神经网络将初始轮廓迭代变形为物体轮廓。   


    微信图片_20220109113932.png      


实例分割是许多计算机视觉项目的基石,许多视频分析,自动驾驶和机器人抓取项目都是基于实例分割。一般的实例分割都是基于像素,本文中的实例分割则是基于轮廓,相较于像素而言参数较少。


Deep Snake的本质就是轮廓模型。为了充分利用轮廓拓扑,论文提出了圆形卷积以有效地学习轮廓模型。 


基于Deep Snake,论文开发了一个两阶段的实例分割:初始轮廓方案和轮廓变形。在数据集的测试中,与直接回归对象边界点的坐标相比,这种方法性能更好。


论文将这个方法放到Cityscapes,Kins,Sbd和COCO数据集上进行测试,取得了很好的效果,并达到了32fps的速度。 


MetaFuse:不依赖特定相机对的人体姿态估计


人体姿态估计已经取得了非常大的进展,但是之前的研究在实际中会遇到一个问题,就是人体被遮挡,之前的很多方案依赖于特定的相机对,缺乏泛化能力。


深睿研究院与北京大学前沿交叉学科研究院大数据中心合作提出了融合多个视角信息的姿态估计方法。  


  微信图片_20220109113934.png


MetaFuse将原有的融合模型分解为:所有相机通用的模型、针对特定相机的轻量级变换矩阵。然后使用元学习增强了模型的泛化能力,只需要少量样本即可完成模型迁移。    


 微信图片_20220109113936.png


通过不同方法估计的人体姿态。每组有4个子图,分别对应于真实情况和三种方法。粉色和青色的关节分别属于右侧和左侧的身体部位。红色箭头突出显示了这三种方法估计的关节位置。从实验结果来看,MetaFuse的各项性能指标明显优于其他方法。 今年的CVPR还有很多值得关注的内容,感兴趣的同学可以去官网查看相关的细节。


参考链接:https://arxiv.org/pdf/2003.13239.pdf
http://cvpr2020.thecvf.com/

相关文章
|
3月前
|
机器学习/深度学习 人工智能 算法
「AI工程师」算法研发与优化-工作指导
**工作指导书摘要:** 设计与优化算法,提升性能效率;负责模型训练及测试,确保准确稳定;跟踪业界最新技术并应用;提供内部技术支持,解决使用问题。要求扎实的数学和机器学习基础,熟悉深度学习框架,具备良好编程及数据分析能力,注重团队协作。遵循代码、文档和测试规范,持续学习创新,优化算法以支持业务发展。
91 0
「AI工程师」算法研发与优化-工作指导
|
2月前
|
机器学习/深度学习 人工智能 算法
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
本文全面介绍了人工智能(AI)的基础知识、操作教程、算法实现及其在实际项目中的应用。首先,从AI的概念出发,解释了AI如何使机器具备学习、思考、决策和交流的能力,并列举了日常生活中的常见应用场景,如手机助手、推荐系统、自动驾驶等。接着,详细介绍了AI在提高效率、增强用户体验、促进技术创新和解决复杂问题等方面的显著作用,同时展望了AI的未来发展趋势,包括自我学习能力的提升、人机协作的增强、伦理法规的完善以及行业垂直化应用的拓展等...
160 3
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
|
2月前
|
存储 人工智能 算法
AI算法的道德与社会影响:探索技术双刃剑的边界
【8月更文挑战第22天】AI算法作为一把双刃剑,在推动社会进步的同时,也带来了诸多道德与社会挑战。面对这些挑战,我们需要以开放的心态、严谨的态度和创新的思维,不断探索技术发展与伦理规范之间的平衡之道,共同构建一个更加美好、更加公正的AI未来。
|
3月前
|
机器学习/深度学习 数据采集 人工智能
AI技术实践:利用机器学习算法预测房价
人工智能(Artificial Intelligence, AI)已经深刻地影响了我们的生活,从智能助手到自动驾驶,AI的应用无处不在。然而,AI不仅仅是一个理论概念,它的实际应用和技术实现同样重要。本文将通过详细的技术实践,带领读者从理论走向实践,详细介绍AI项目的实现过程,包括数据准备、模型选择、训练和优化等环节。
239 3
|
3月前
|
存储 机器学习/深度学习 人工智能
AI Agent技术的最新进展与改变世界的典型项目巡礼
【7月更文挑战第3天】 AI Agent技术的最新进展与改变世界的典型项目巡礼
 AI Agent技术的最新进展与改变世界的典型项目巡礼
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
126 9
|
3月前
|
存储 算法 Python
火箭般的提升!学会Python并查集,让你的算法能力飞跃新高度!
【7月更文挑战第17天】并查集,高效解决集合合并查询问题,常用于图的连通性判断。Python实现关键包含查找和合并操作。初始化时,元素各自为集合。查找使用路径压缩优化,合并则可选按秩策略保持平衡。例如,检测无向图环路,遍历边,若并查集发现边两端已在同一集合,则存在环。掌握并查集,提升算法能力,助你在问题解决中一飞冲天!动手实践,成为算法达人!
45 2
|
3月前
|
机器学习/深度学习 人工智能 算法
深入了解AI算法及其实现过程
人工智能(AI)已经成为现代技术发展的前沿,广泛应用于多个领域,如图像识别、自然语言处理、智能推荐系统等。本文将深入探讨AI算法的基础知识,并通过一个具体的实现过程来展示如何将AI算法应用于实际问题。
112 0
|
3月前
|
人工智能 自然语言处理 算法
昆仑万维携手南洋理工大学抢发Q*算法:百倍提升7B模型推理能力
【7月更文挑战第4天】昆仑万维与南洋理工大学推出Q*算法,大幅提升7B规模语言模型的推理效能。Q*通过学习Q值模型优化LLMs的多步推理,减少错误,无需微调,已在多个数据集上展示出显著优于传统方法的效果。尽管面临简化复杂性和效率挑战,这一创新为LLM推理能力提升带来重大突破。[论文链接:](https://arxiv.org/abs/2406.14283)**
40 1
|
3月前
|
机器学习/深度学习 数据采集 人工智能

热门文章

最新文章

下一篇
无影云桌面