斯坦福吴恩达团队公布最大医学影像数据集

简介: 本文来自AI新媒体量子位(QbitAI) 据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。 为了加快X光片的诊断速度,近日斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。
本文来自AI新媒体量子位(QbitAI)

据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。

为了加快X光片的诊断速度,近日斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。

最后训练的结果,是该模型在手指和手腕X光片中的诊断表现比放射科医生要好些。

 经过MURA训练的模型可以准确定位出手腕和手指的异常部位

不过放射医生依然能比模型更准确地诊断出手肘、前臂、手、上臂及肩膀的异常。

 图中绿色字体表示表现最优,红色字体代表表现最差。模型对手指、手腕的诊断效果要比三位放射医生的效果都要好。手肘和前臂的诊断结果比人类都差。

该神经网络含有169层。当输入多角度的上肢X光片时,模型就可以预测出异常的概率。

 模型预测X光片异常的工作流

作为最大的医学影像数据集,MURA所含的4万张图都是由放射科医生一张张标注的。

 人工标注的4万张X光片。左上,正常的手肘;右上,骨折的上臂;左下,骨骼退化的指端;右下,打了钢板和钢钉的尺骨和桡骨。

这四万张图来自近15000篇论文,其中9067篇为正常上肢骨骼肌X光片的研究,5915篇是异常研究。上肢包括肩膀、肱部、手肘、前臂、手腕、手、指端。

现在,越来越多的数据集涌现出来,给深度学习提供了非常好的条件。AI算法在图像识别上能逐步超越人类很大程度上得益于这些数据集的开源。下面列举一些目前在医学影像数据集供大家参考。

 MURA目前是最大的开源医学放射图像数据集。第二大的数据集是Pediatric Bone,含有14236张图,可以根据手的X光片测出人的骨龄;0.E.1是关于膝关节的数据集,可用来查出膝关节炎。

不过,依照目前AI发展的速度来看,医学院应该停止培养放射专业的学生了。多伦多大学计算机系教授Geoffrey Hinton在接受纽约客采访时认为。

最后,附论文链接:
https://arxiv.org/pdf/1712.06957.pdf
数据集要等到2月才会公布,可以持续关注Stanford ML
https://stanfordmlgroup.github.io/projects/mura/

本文作者:Root
原文发布时间:2018-01-19
相关文章
|
7月前
|
机器学习/深度学习 文字识别 监控
【论文速递】20 年的目标检测:一项调查
【论文速递】20 年的目标检测:一项调查
|
7月前
|
机器学习/深度学习 人工智能 边缘计算
【论文速递】9位院士Science88页长文:人工智能的进展、挑战与未来
【论文速递】9位院士Science88页长文:人工智能的进展、挑战与未来
|
5月前
|
数据采集 人工智能 测试技术
datawhale AI夏令营 ABM预测
Starting on 2024.07.26, aim to deeply understand ABM's principles, construction methods, applications,
|
机器学习/深度学习 存储 人工智能
当AI遇上量子化学,这是NeurIPS 2022挑战赛的冠军解决方案
当AI遇上量子化学,这是NeurIPS 2022挑战赛的冠军解决方案
106 0
|
机器学习/深度学习 人工智能 监控
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
158 0
|
机器学习/深度学习 人工智能 自然语言处理
斯坦福春季新课:用数据科学、机器学习对COVID-19研究建模
斯坦福春季新课:用数据科学、机器学习对COVID-19研究建模
160 0
|
机器学习/深度学习 自然语言处理 算法
称霸Kaggle的十大深度学习技巧
称霸Kaggle的十大深度学习技巧。
36901 0
|
机器学习/深度学习 人工智能
“Google只认钱!机器学习20年没进步”,CMU学者炮轰AI第一大厂
这几天,一位耿直的CMU学者Simon DeDeo,在在Twitter上猛烈炮轰Google Brain团队,对营利性机器学习行业展开嘲讽。(其实也顺便无情抨击了Facebook的研究机构。)
1296 0
|
机器学习/深度学习 自然语言处理 算法
2017 CIKM机器学习大赛分析与总结
1 前言与背景     为提升对前沿算法技术的研究和理解,去年以个人参赛的方式参加了CIKM 国际数据挖掘大赛AnalytiCup,尝试在7月-8月的一个月时间内,利用业余时间,独立搭建了一套简单的自然语言学习框架,最终在与169支队伍竞技中获得第16名的成绩。     这次比赛是我个人的第一次简单尝试,由于业务较紧,年前没有时间写下来,现在回过头来总结
12028 0
|
机器学习/深度学习 人工智能 自然语言处理
【收藏】2018年不容错过的20大人工智能/机器学习/计算机视觉等顶会时间表
计算机科学,尤其是人工智能领域相比其他学科更重视会议,最新、最重要的工作往往先发表在相关顶会上。本文介绍了2018年值得关注的20个顶会,包括人工智能、机器学习、计算机视觉、自然语言处理、体系结构等领域。
8323 0