MedRAX:专注于胸部X光检查的AI医学推理智能体,帮助医生快速解读胸部X光片

本文涉及的产品
图像搜索,任选一个服务类型 1个月
简介: MedRAX 是一款专门用于胸部X光检查的医学推理AI智能体,整合了多种最先进的分析工具,支持多模态推理和动态任务分解。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


大家好,我是蚝油菜花,今天跟大家分享一下 MedRAX 这个由多所知名机构联合推出的AI医学推理智能体,专为胸部X光检查和解决复杂医学问题而设计。

🚀 快速阅读

MedRAX 是一款用于胸部X光检查的医学推理AI智能体。

  1. 核心功能:整合多种最先进的分析工具,支持多模态推理和动态任务分解。
  2. 技术原理:基于LangChain和LangGraph框架,使用具备视觉能力的GPT-4o作为核心语言模型。

MedRAX 是什么

MedRAX(Medical Reasoning Agent for Chest X-ray)是专门为胸部X光检查设计的医学推理AI智能体。通过整合最先进的胸部X光分析工具和多模态大型语言模型,MedRAX能够动态利用这些模型解决复杂的医学查询问题,无需额外训练。MedRAX的核心架构基于LangChain和LangGraph框架,使用具备视觉能力的GPT-4o作为核心语言模型,支持本地和云端部署,并通过Gradio构建了生产级的用户界面。

MedRAX的目标是通过多模态推理和多步骤任务分解,帮助医生快速准确地解读胸部X光片,从而提高诊断效率和准确性。

MedRAX 的主要功能

  • 多模态医学推理:整合多种最先进的胸部X光(CXR)分析工具和多模态大型语言模型,动态利用这些模型解决复杂的医学查询问题,无需额外训练。
  • 多步骤推理支持:将复杂的医疗查询分解为多个子任务,并逐一解决,包括检测、分类、定位、比较、关系分析、诊断和特征描述。
  • 强大的工具集成:集成了多种工具,如视觉问答(CheXagent和LLaVA-Med)、图像分割(MedSAM和PSPNet)、病变定位(Maira-2)、报告生成(SwinV2 Transformer)、疾病分类(DenseNet-121)以及X光生成(RoentGen)等。
  • 用户友好界面与灵活部署:提供了一个生产级的用户界面,支持本地和云端部署,能够满足不同医疗场景下的隐私和安全需求。
  • 性能验证与基准测试:通过ChestAgentBench基准测试,MedRAX在2500个复杂医疗查询中表现出色,覆盖检测、分类、定位等多个核心能力,其性能优于开源和专有模型。

MedRAX 的技术原理

MedRAX-figure

  • 核心架构:MedRAX基于LangChain和LangGraph框架构建,使用具备视觉能力的GPT-4o作为核心语言模型。架构支持动态工具编排,能根据复杂的医疗查询自动选择最优的工具组合。
  • 多模态推理与工具集成:MedRAX整合了多种工具,实现多模态推理和精准诊断:
    • 视觉问答(Visual QA):基于CheXagent和LLaVA-Med进行复杂的视觉理解和医学推理。
    • 图像分割(Segmentation):使用MedSAM和在ChestX-Det上训练的PSPNet模型进行精确的解剖结构识别。
    • 病变定位(Grounding):通过Maira-2在医学图像中精确定位特定发现。
    • 报告生成(Report Generation):使用在CheXpert Plus上训练的SwinV2 Transformer生成详细的医学报告。
    • 疾病分类(Disease Classification):基于TorchXRayVision中的DenseNet-121检测18种病理类别。
    • X光生成(X-ray Generation):使用RoentGen生成合成的胸部X光。
  • 动态推理与多步骤任务分解:MedRAX能将复杂的医疗查询分解为多个子任务,逐一解决。例如,可以识别病变(检测)、对病变进行分类(分类)、精确定位病变位置(定位)、比较病变的变化(比较)、分析病变之间的关系(关系)、进行临床诊断(诊断)以及描述病变特征(特征描述)。

如何运行 MedRAX

1. 安装依赖

# Clone the repository
git clone https://github.com/bowang-lab/MedRAX.git
cd MedRAX

# Install package
pip install -e .

2. 启动 Gradio 界面

# Start the Gradio interface
python main.py

如果遇到权限问题,可以尝试以下命令:

sudo -E env "PATH=$PATH" python main.py

3. 设置模型目录

确保在 main.py 中设置 model_dir,指向你希望下载或已经存放工具权重的目录。同时,确保在 .env 文件中配置你的 OpenAI API 密钥。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
7天前
|
人工智能 运维 自然语言处理
“AI医生”入驻运维现场:聊聊系统健康检查的新姿势
“AI医生”入驻运维现场:聊聊系统健康检查的新姿势
126 78
|
1月前
|
人工智能 自然语言处理 数据可视化
AutoAgents:比LangChain更激进的AI开发神器!自然语言生成AI智能体军团,1句话搞定复杂任务
AutoAgents 是基于大型语言模型的自动智能体生成框架,能够根据用户设定的目标自动生成多个专家角色的智能体,通过协作完成复杂任务。支持动态生成智能体、任务规划与执行、多智能体协作等功能。
225 91
|
17天前
|
人工智能 数据库 决策智能
Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体
Archon 是一个开源的 AI 智能体框架,能够自主生成代码并优化智能体性能,支持多智能体协作、领域知识集成和文档爬取等功能,适用于企业、教育、智能家居等多个领域。
125 10
Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体
|
11天前
|
人工智能 自然语言处理 安全
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目
Anus 是一个开源 AI 智能体项目,复刻了 Manus 的部分功能,支持自然语言指令执行、多代理协作、多模态输入处理等功能,旨在为开发者提供强大且灵活的工具。
200 1
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目
|
1月前
|
人工智能 搜索推荐 API
node-DeepResearch:开源复现版OpenAI Deep Research,支持多步推理和复杂查询的AI智能体
node-DeepResearch 是一个开源 AI 智能体项目,支持多步推理和复杂查询,帮助用户逐步解决问题。
296 27
node-DeepResearch:开源复现版OpenAI Deep Research,支持多步推理和复杂查询的AI智能体
|
14天前
|
人工智能 自然语言处理 前端开发
Spring AI与DeepSeek实战二:打造企业级智能体
本文介绍如何基于Spring AI与DeepSeek模型构建企业级多语言翻译智能体。通过明确的Prompt设计,该智能体能自主执行复杂任务,如精准翻译32种ISO标准语言,并严格遵循输入格式和行为限制。代码示例展示了如何通过API实现动态Prompt生成和翻译功能,确保服务的安全性和可控性。项目已开源,提供更多细节和完整代码。 [GitHub](https://github.com/zlt2000/zlt-spring-ai-app) | [Gitee](https://gitee.com/zlt2000/zlt-spring-ai-app)
135 11
|
19天前
|
缓存 人工智能 自然语言处理
微软发明全新LLM语言,AI智能体交互效率翻倍!
微软发布DroidSpeak技术,优化大型语言模型(LLM)间的通信,显著提升AI智能体交互效率。该技术通过嵌入缓存和键值缓存重用,减少预填充延迟,降低高达50%的延迟,同时保持高质量生成。DroidSpeak适用于多种AI任务,提高协作效率,但在资源受限环境和处理模型差异性方面仍面临挑战。
43 3
|
25天前
|
人工智能
D1net阅闻 | OpenAI进军虚拟助手领域 AI智能体加速迈入商业化阶段
D1net阅闻 | OpenAI进军虚拟助手领域 AI智能体加速迈入商业化阶段
|
24天前
|
机器学习/深度学习 人工智能 搜索推荐
上百万智能体在OASIS模拟平台上玩推特,AI玩社交媒体和真人有多像?
OASIS是一个模拟平台,利用大型语言模型(LLM)驱动的智能体模拟社交媒体上的行为,研究复杂社会系统现象。它模仿推特和Reddit等平台,支持动态环境、多样行动和推荐系统。通过模拟上百万个智能体,OASIS帮助研究人员大规模分析信息传播和社会互动,但仍面临规模、行为多样性及伦理隐私挑战。论文:https://arxiv.org/abs/2411.11581
41 6
|
1月前
|
人工智能 Java API
支持 40+ 插件,Spring AI Alibaba 简化智能体私有数据集成
通过使用社区官方提供的超过 20 种 RAG 数据源和 20 种 Tool Calling 接口,开发者可以轻松接入多种外部数据源(如 GitHub、飞书、云 OSS 等)以及调用各种工具(如天气预报、地图导航、翻译服务等)。这些默认实现大大简化了智能体的开发过程,使得开发者无需从零开始,便可以快速构建功能强大的智能体系统。通过这种方式,智能体不仅能够高效处理复杂任务,还能适应各种应用场景,提供更加智能、精准的服务。

热门文章

最新文章