斯坦福吴恩达团队公布最大医学影像数据集

简介: 本文来自AI新媒体量子位(QbitAI) 据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。 为了加快X光片的诊断速度,近日斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。
本文来自AI新媒体量子位(QbitAI)

据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。

为了加快X光片的诊断速度,近日斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。

最后训练的结果,是该模型在手指和手腕X光片中的诊断表现比放射科医生要好些。

 经过MURA训练的模型可以准确定位出手腕和手指的异常部位

不过放射医生依然能比模型更准确地诊断出手肘、前臂、手、上臂及肩膀的异常。

 图中绿色字体表示表现最优,红色字体代表表现最差。模型对手指、手腕的诊断效果要比三位放射医生的效果都要好。手肘和前臂的诊断结果比人类都差。

该神经网络含有169层。当输入多角度的上肢X光片时,模型就可以预测出异常的概率。

 模型预测X光片异常的工作流

作为最大的医学影像数据集,MURA所含的4万张图都是由放射科医生一张张标注的。

 人工标注的4万张X光片。左上,正常的手肘;右上,骨折的上臂;左下,骨骼退化的指端;右下,打了钢板和钢钉的尺骨和桡骨。

这四万张图来自近15000篇论文,其中9067篇为正常上肢骨骼肌X光片的研究,5915篇是异常研究。上肢包括肩膀、肱部、手肘、前臂、手腕、手、指端。

现在,越来越多的数据集涌现出来,给深度学习提供了非常好的条件。AI算法在图像识别上能逐步超越人类很大程度上得益于这些数据集的开源。下面列举一些目前在医学影像数据集供大家参考。

 MURA目前是最大的开源医学放射图像数据集。第二大的数据集是Pediatric Bone,含有14236张图,可以根据手的X光片测出人的骨龄;0.E.1是关于膝关节的数据集,可用来查出膝关节炎。

不过,依照目前AI发展的速度来看,医学院应该停止培养放射专业的学生了。多伦多大学计算机系教授Geoffrey Hinton在接受纽约客采访时认为。

最后,附论文链接:
https://arxiv.org/pdf/1712.06957.pdf
数据集要等到2月才会公布,可以持续关注Stanford ML
https://stanfordmlgroup.github.io/projects/mura/

本文作者:Root
原文发布时间:2018-01-19
相关文章
|
1月前
|
人工智能 安全 API
保姆级图文教程!OpenClaw阿里云/本地MacOS/Windows部署+免费大模型API配置接入15000+Skill指南
当ClawHub的技能数量突破14946个,OpenClaw早已从“单一AI工具”进化为“模块化生产力生态”。技能(Skill)作为AI的“执行身份”,让OpenClaw能在设计总监、增长黑客、法律顾问等角色间无缝切换,一个人+一套技能组合即可搭建微型工作室。但繁华背后暗藏危机——2026年初爆发的ClawHavoc事件,335个恶意技能通过远程代码执行漏洞窃取API Key、注入恶意脚本,让无数用户遭遇“挖矿盗刷”的损失。
1467 16
|
6月前
|
存储 前端开发 Java
基于Spring AI Alibaba 的 DeepResearch 架构与实践
基于SpringAI Alibaba Graph构建的Java版DeepResearch系统,实现信息搜集、分析到结构化报告生成的全自动流程。支持多轮推理、RAG检索、MCP扩展、可观测性及可溯源输出,集成主流搜索工具与多种数据源,具备高可扩展性与企业级应用能力。
基于Spring AI Alibaba 的 DeepResearch 架构与实践
|
机器学习/深度学习 人工智能 数据可视化
AI开源框架:让分布式系统调试不再"黑盒"
Ray是一个开源分布式计算框架,专为支持可扩展的人工智能(AI)和Python应用程序而设计。它通过提供简单直观的API简化分布式计算,使得开发者能够高效编写并行和分布式应用程序 。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景,并构建了丰富而成熟的技术生态。
1853 102
AI开源框架:让分布式系统调试不再"黑盒"
|
9月前
|
人工智能 安全 机器人
使用PAI LangStudio创建RAG知识库及联网搜索聊天机器人
本文介绍如何基于阿里云PAI的LangStudio与LLM构建支持RAG与联网搜索的聊天机器人。内容涵盖SerpAPI注册、模型部署、连接配置、知识库创建及应用流设计,实现结合知识库与网络搜索的智能问答,并集成AI安全护栏,提升企业应用安全性与开发效率。
|
人工智能 搜索推荐 前端开发
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
OpenDeepSearch是基于开源推理模型的深度搜索工具,通过语义重排和多源整合优化检索效果,支持与AI代理无缝集成,提供快速和专业两种搜索模式。
826 10
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
|
存储 JavaScript
Vue3使用Pinia获取全局状态变量
Vue3使用Pinia获取全局状态变量
701 4
|
弹性计算 网络安全
快速部署 RAGFlow 社区版
RAGFlow是一个基于深度文档理解的开源RAG(检索增强生成)引擎。当与LLM集成时,它能够提供真实的问答功能,并得到各种复杂格式数据的充分引用的支持。本文介绍如何通过计算巢快速部署 RAGFlow社区版。
快速部署 RAGFlow 社区版
|
网络协议 网络架构
配置思科多区域 OSPF
【8月更文挑战第31天】
1108 0
配置思科多区域 OSPF
|
JavaScript 前端开发 开发者
Element-UI快速入门
Element-UI快速入门Element-UI快速入门
1614 0
Element-UI快速入门
|
机器学习/深度学习 缓存 PyTorch
异步数据加载技巧:实现 DataLoader 的最佳实践
【8月更文第29天】在深度学习中,数据加载是整个训练流程中的一个关键步骤。为了最大化硬件资源的利用率并提高训练效率,使用高效的数据加载策略变得尤为重要。本文将探讨如何通过异步加载和多线程/多进程技术来优化 DataLoader 的性能。
2648 1