【75位联合作者Nature重磅】AI药神:机器学习模型有望提前五年预测白血病!

简介: 来自全球多家科研机构的75位科学家在《自然》发表了一项重磅研究:使用血液检测和机器学习技术,可以预测健康个体是否有患急性骨髓性白血病(AML)的风险。这项研究意味着我们可以提早发现AML的高风险人群并进行监测,同时可以进行研发,寻找降低该疾病患病几率的方案。

【新智元导读】来自全球多家科研机构的75位科学家在《自然》发表了一项重磅研究:使用血液检测和机器学习技术,可以预测健康个体是否有患急性骨髓性白血病(AML)的风险。这项研究意味着我们可以提早发现AML的高风险人群并进行监测,同时可以进行研发,寻找降低该疾病患病几率的方案。

本周,《自然》上发表了一项重磅研究:一个由来自全球多家科研机构的白血病科学家组成的研究小组使用血液检测和机器学习技术,来预测健康个体是否有患急性骨髓性白血病(AML)的风险。这项研究意味着我们可以提早发现AML的高风险人群并进行监测,同时可以进行研发,寻找降低该疾病患病几率的方案。

image

来自全球多家科研机构的75位作者在Nature发表论文

急性骨髓性白血病(AML)是一种进展迅速、危及生命的血液肿瘤,可以影响所有年龄段的人群。AML患者的癌细胞在骨髓中迅速增殖,并妨碍正常血液细胞的产生,导致出现出血和感染症状,甚至危及生命。近几十年以来,AML主流治疗手段几乎没有任何变化,虽然少数患者被治愈,但对于绝大多数患者来说,这仍然是一种绝症。

image

急性骨髓性白血病是一种进展迅速且危及生命的癌症(图片来源:123RF)

为了揭示AML的病因,研究人员使用一项欧洲大型人口健康及生活方式研究中收集的数据及血液样本来进行调查。这项大型研究在20年内追踪了55万人的数据,其中有一些人后来患上了AML。利用这些人的血液样本数据,研究人员能够回顾在AML出现几年之前,这些患者血液中存在的基因变化。

研究人员开发了一种基因测序工具,针对那些与AML相关的已知基因,对124名AML患者的血液DNA进行了测序,并与676名未患有AML或相关癌症的人进行了对比。值得注意的是,他们发现许多后来患有AML的人基因中出现了特殊的遗传变化,而未患有AML的人则没有出现这种变化。并且,那些后来患上AML的患者基因中的突变数量更多,且这些突变在他们血液细胞中出现的比例也更高。

接下来,研究人员应用了机器学习技术,在电子健康记录中常规记录变量的基础之上,构建了一个AML预测模型。该模型在进行诊断前的6-12个月内,就能够对AML进行预测,其灵敏度和特异性分别达到25.7%和98.2%。该模型在不同年龄组之间的表现是一致的。

image

使用机器学习技术构建的AML预测模型结果示意图(图片来源:《Nature》)

“通常来说,急性骨髓性白血病是一种突发性疾病,”该论文的作者之一、来自Wellcome Sanger Institute和剑桥大学的Grace Collord博士表示:“而此次我们发现,它的病因在患上该疾病的五年之前就可以检测到,这一点让我们非常惊讶。这项研究为我们研发能够检测AML高风险人群的方案,提供了非常重要的科学依据。”

研究人员还表示,希望在这些研究结果的基础上,可以开展大型筛查检测,从而识别出那些具有AML高风险的人群,并推动预防AML进一步发展的相关研究,造福更多的患者。随着人工智能的飞速发展和医疗技术的不断进步,希望这项研究在未来可以为我们带来战胜白血病的新方法。

论文地址:https://www.nature.com/articles/s41586-018-0317-6
参考资料:
[1] Roots of leukemia reveal possibility of predicting people at risk
[2] Leukemia researchers discover way to predict healthy people at risk for developing AML
[3] Prediction of acute myeloid leukaemia risk in healthy individuals

新智元:
原文发布时间为:2018-07-11
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。
原文链接:【75位联合作者Nature重磅】AI药神:机器学习模型有望提前五年预测白血病!

相关文章
|
6月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
1099 109
|
8月前
|
机器学习/深度学习 人工智能 监控
AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程
本系列文章深入讲解了从Seq2Seq、RNN到Transformer,再到GPT模型的关键技术原理与实现细节,帮助读者全面掌握Transformer及其在NLP中的应用。同时,通过一个房价预测的完整案例,介绍了算法工程师如何利用数据训练模型并解决实际问题,涵盖需求分析、数据收集、模型训练与部署等全流程。文章适合初学者和开发者学习AI基础与实战技能。
992 25
AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程
|
9月前
|
人工智能 监控 测试技术
云上AI推理平台全掌握 (1):PAI-EAS LLM服务一键压测
在AI技术飞速发展的今天,大语言模型(LLM)、多模态模型等前沿技术正深刻改变行业格局。推理服务是大模型从“实验室突破”走向“产业级应用”的必要环节,需直面高并发流量洪峰、低延时响应诉求、异构硬件优化适配、成本精准控制等复杂挑战。 阿里云人工智能平台 PAI 致力于为用户提供全栈式、高可用的推理服务能力。在本系列技术专题中,我们将围绕分布式推理架构、Serverless 弹性资源全球调度、压测调优和服务可观测等关键技术方向,展现 PAI 平台在推理服务侧的产品能力,助力企业和开发者在 AI 时代抢占先机,让我们一起探索云上 AI 推理的无限可能,释放大模型的真正价值!
|
9月前
|
机器学习/深度学习 PyTorch API
昇腾AI4S图机器学习:DGL消息传递接口的PyG替换
DGL (Deep Graph Learning) 和 PyG (Pytorch Geometric) 是两个主流的图神经网络库,它们在API设计和底层实现上有一定差异,在不同场景下,研究人员会使用不同的依赖库,昇腾NPU对PyG图机器学习库的支持亲和度更高,因此有些时候需要做DGL接口的PyG替换。
|
9月前
|
机器学习/深度学习 PyTorch API
昇腾AI4S图机器学习:DGL图构建接口的PyG替换
本文探讨了在图神经网络中将DGL接口替换为PyG实现的方法,重点以RFdiffusion蛋白质设计模型中的SE3Transformer为例。SE3Transformer通过SE(3)等变性提取三维几何特征,其图构建部分依赖DGL接口。文章详细介绍了两个关键函数的替换:`make_full_graph` 和 `make_topk_graph`。前者构建完全连接图,后者生成k近邻图。通过PyG的高效实现(如`knn_graph`),我们简化了图结构创建过程,并调整边特征处理逻辑以兼容不同框架,从而更好地支持昇腾NPU等硬件环境。此方法为跨库迁移提供了实用参考。
|
5月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习算法篇】K-近邻算法
K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
1461 6
|
10月前
|
机器学习/深度学习 数据采集 人工智能
20分钟掌握机器学习算法指南
在短短20分钟内,从零开始理解主流机器学习算法的工作原理,掌握算法选择策略,并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻,帮助你告别算法选择的困惑,轻松踏入AI的大门。
667 8
|
11月前
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。