【Nature重磅】再创纪录!百余家实验室近150位科学家联合开发超级AI系统,精准诊断近100种脑癌

简介: 距离我们上次报道张康教授的重磅AI研究还不到一个月,来自全球100多个实验室的近150位科学家联合在顶级期刊《自然》发文,他们开发了一个超级AI系统,基于肿瘤组织DNA的甲基化数据,可以准确区分近100种不同的中枢神经系统肿瘤。

这个AI系统还能发现一些指南里面没有的新分类。这对于癌症的精准治疗而言,又是个巨大的进步。

33a2235961a65d01e0975f240b843199c93e893a

这项研究一方面能够弥补目前中枢神经系统肿瘤难以诊断的问题,一方面也是为尚不完善的中枢神经系统肿瘤分类做出了极大的贡献。

在诸多癌症中,中枢神经系统肿瘤可以说是最难搞的。目前科学家已经确定的中枢神经系统肿瘤足有100来种[2],它们的临床表现和生物学特性有高度特异性,很难确诊。由于此类肿瘤的分子标志物稀少,目前临床上中枢神经系统肿瘤的诊断核心技术还是基于显微镜的组织学诊断

不过难点在于,很多在显微镜下表现相似的肿瘤,实际上有不同的基因变异特点,这些几乎是很难观察到的,这就给精准诊断带来了极大的困难。虽然FDA已经批准了基于组织病理学切片成像辅助诊断疾病的技术[3],也有很多创业公司开始尝试利用AI分析这些病理图片,辅助医生诊断。然而上面存在的问题依然不能避免。

所以近年来WHO也逐渐在分类标准中增加了分子指标,例如几种与特定脑癌亚型相关的基因变异和甲基化情况。

Andreas von Deimling和Stefan M. Pfister领导的这个国际团队认为,分析癌症的甲基化组是个很聪明的做法,甲基化特征一方面能够标志相应的细胞变化,一方面还能够用于追踪细胞来源,例如用来诊断那些病灶不明的癌症[4]。而且前人的实验也证实了癌症甲基化数据的可靠性,即使在很小的样本中也能够得到重复[5]。现在研究者们要做的就是,在这些零散的数据基础上继续扩大,让癌症甲基化组能够成为一个统一标准的、全方位的诊断和分类工具。

不过这里面有个大问题就是,甲基化数据从哪里来。开发AI系统是需要大量的数据训练算法的,但是限于之前技术不足和高昂的成本,针对某种特定肿瘤的甲基化数据显然是严重不足的,更何况这还是个发病率不是特别高的中枢神经系统肿瘤。

感谢技术的进步。现在科学家已经可以很容易的从经福尔马林固定后石蜡包埋的少量组织(FFPE)中提取DNA,这就解决了实验材料的来源问题。尽管没有足够的肿瘤DNA甲基化数据,但是在全世界的很多实验室和医疗机构中,都保存有FFPE样本。

于是,这个庞大的研究团队开始收集FFPE样本,并用Illumina公司的主流甲基化芯片450K(可分析人体45万个甲基化位点)分析近3000份肿瘤样本的甲基化数据,几乎覆盖了目前WHO分类中全部的中枢神经系统肿瘤种类。此外,为了区分中枢神经系统肿瘤与其他肿瘤和正常脑组织之间的差异,研究团队还分析了部分间充质肿瘤、黑色素瘤、弥漫性大B细胞淋巴瘤、浆细胞瘤以及6种垂体腺瘤,以及健康脑组织的DNA甲基化情况。

b85c753014855a90552b9c0d8120e231d3095cee

决策过程

研究人员把每个样本的几十万个甲基化信息一股脑交给计算机,首先根据WHO的分类以及样本的诊断结果,在有监督的机器学习算法下,分析WHO定义的每类肿瘤的甲基化特征;然后又无监督的机器学习算法再分析一遍,让AI系统总结出自己对中枢神经系统肿瘤甲基化的认知

最后,他们得到了82个中枢神经系统肿瘤甲基化特征,以及9个对照样本的甲基化特征。这91个甲基化特征就是AI系统在WHO定义的指导下,对中枢神经系统肿瘤甲的分类。显然,AI系统对中枢神经系统肿瘤的分类,肯定不可能完全与WHO的分类完全重合。

研究人员把这82个甲基化特征分成了5类。

第一类的29个是完全与WHO的分类匹配的,就是说,AI系统认为这些甲基化特征分别属于某一类肿瘤,按照WHO的分类标准,医生之前的诊断确实也是属于这个分类。第二类也有29个,他们能与WHO分类中的某种肿瘤下面的亚类型匹配

剩下的就是只能部分匹配,或者完全不能匹配。而这些也是研究人员最感兴趣的,他们认为,这一发现可以帮助研究人员更深入的理解中枢神经系统肿瘤

24c68f768670a244031711ef1fa5b62b8fd0779b

a,91个甲基化特征,以及它们所属的5个类别;b,2801个样本的甲基化特征降维数据图

到此,中枢神经系统肿瘤的甲基化特征已经被AI系统提取,加上对照组,一共有91个。显然,如果研究就到此为止的话,使用价值还是有限的。毕竟,人工分析每个样本的甲基化类型与这91个匹配情况是件非常费时费力的事情。

于是,他们把这91个甲基化类型交给了随机森林机器学习算法,开发出一个AI决策系统,只要研究人员将从测序机器上下来的甲基化数据导入这个AI系统,就可以快速判断这个肿瘤属于哪一种

为了验证这些甲基化特征和AI决策系统的准确性。研究者选取了1104份已经组织学和分子生物学诊断的中枢神经系统肿瘤患者组织样本,同时用传统的标准组织病理学分析和这个AI系统进行诊断。

结果,在60.4%的样本上,AI系统和病理学家诊断是一致的。15.5%的样本AI系统和病理学家的也是一致的,只不过AI系统认为,它们应该属于一个更小的亚型

有12.6%的病例,AI系统和病理学家诊断的结果不一致。那到底是AI系统对,还是病理学家对?于是研究人员对这部分样本做了更加深入的分析(例如基因测序),最后惊喜的发现,92.8%的样本是AI系统对了

最后剩余的11.5%的样本,AI系统表示无能为力,不知道该如何分类,仔细分析发现,其中三分之一是罕见肿瘤,可能是前期的样本量不够,导致AI系统无法识别。因此,这部分随着数据的积累,或许可以解决。

3a08e22b3ce9252e54df6d845c2aaec8e4ed5a32

AI系统对病例的识别情况

目前该AI平台已经免费向研究机构开放[6],自2016年上线以来,已经有近万份个体DNA甲基化数据上传!实用性已经得到千余例真实病例的支持。

当然,研究者也提出,甲基化特征还不能作为单一的诊断标准,还需要临床的验证。不过作为研究的工具,它着实将使中枢神经系统肿瘤科研前进一大步。

一方面,统一的、易于使用的标准将使科研变得更加条理分明;另一方面,甲基化组明确的数据特征也便于使用计算机进行分析。有了这项技术,我们对肿瘤的分类将会更具动态并逐渐走向完善,最终带来更加精准、有针对性的治疗方案。


原文发布时间为:2018-03-19

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【Nature重磅】再创纪录!百余家实验室近150位科学家联合开发超级AI系统,精准诊断近100种脑癌

相关文章
|
24天前
|
机器学习/深度学习 人工智能 数据可视化
首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist
【9月更文挑战第11天】Sakana AI公司近日推出全球首个全自动科学发现AI系统——AI Scientist,实现了人工智能在科学研究领域的重大突破。AI Scientist不仅能独立完成从假设提出到实验设计、数据分析及论文撰写的全过程,还能通过模拟评审提升研究成果的质量。该系统已成功应用于机器学习的多个子领域,并产出达到顶级会议标准的论文。尽管其高效性备受赞誉,但也引发了关于研究可信度和潜在风险的讨论。Sakana AI强调,系统具备可追溯的决策过程与严格的评审机制,确保了研究的可靠性和透明度。论文详情参见:[链接]。
58 6
|
3天前
|
人工智能 自然语言处理 搜索推荐
AI技术在智能客服系统中的应用与挑战
【9月更文挑战第32天】本文将探讨AI技术在智能客服系统中的应用及其面临的挑战。我们将分析AI技术如何改变传统客服模式,提高服务质量和效率,并讨论在实际应用中可能遇到的问题和解决方案。
93 65
|
9天前
|
存储 人工智能 算法
AI伦理学:建立可信的智能系统框架
【9月更文挑战第26天】随着AI技术的迅猛发展,其在各领域的应用日益广泛,但也带来了算法偏见、数据隐私泄露、就业替代等伦理和法律挑战。本文探讨AI伦理学的核心议题,包括数据隐私保护、算法公平性与透明度、机器决策责任归属及对就业市场的影响,并提出建立可信智能系统框架的建议,如强化法律法规、技术创新、建立监督机制、行业自律和公众教育,以确保AI技术的可持续发展和社会接受。
|
20天前
|
人工智能 数据处理
Nature:AI让抄袭问题更加复杂,科学家该如何应对?
【9月更文挑战第16天】《自然》杂志一篇文章指出,AI在科研领域的应用日益增长,带来了加速数据处理、提升计算效率等益处,同时也引发了对科学标准、数据偏见及研究诚信的挑战。一项针对1600多名研究人员的调查显示,超半数认为未来十年AI将成为其研究领域不可或缺的工具。AI能够显著提升科研效率,但也可能增加对模式识别的依赖,加剧数据偏见,并引发研究不可重复性等问题。尤其是大型语言模型如ChatGPT,虽有助于改进论文语法和翻译,但也可能传播错误信息。此外,部分科学家面临计算资源和高质量数据不足等使用障碍。
22 3
|
27天前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
33 4
|
27天前
|
机器学习/深度学习 人工智能 算法
首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策
【9月更文挑战第8天】近日,《自然》子刊发表的一篇关于RTNet神经网络的论文引起广泛关注。RTNet能模拟人类感知决策思维,其表现与人类相近,在反应时间和准确率上表现出色。这项研究证明了神经网络可模拟人类思维方式,为人工智能发展带来新启示。尽管存在争议,如是否真正理解人类思维机制以及潜在的伦理问题,但RTNet为人工智能技术突破及理解人类思维机制提供了新途径。论文详细内容见《自然》官网。
33 3
|
1月前
|
人工智能 监控 安全
AI计算机视觉笔记十三:危险区域识别系统
本文介绍了如何在 IPC 监控视频中实现区域入侵检测,通过 YOLOv5 和 ByteTrack 实现人物检测与多目标跟踪。系统能在检测到人员进入预设的危险区域时发出警报,保障安全。主要步骤包括:1)使用 YOLOv5 识别人物;2)使用 ByteTrack 进行多目标跟踪;3)利用射线法判断物体是否进入禁区内。项目基于 Python 开发,使用海思、君正、RK 等摄像头模组,代码已在 RV1126 上验证,计划移植至 RK3568 平台。项目结构清晰,包含模型训练、跟踪算法及图形化界面展示等功能。
|
9天前
|
机器学习/深度学习 数据采集 人工智能
探索AI技术在文本生成中的应用与挑战
【9月更文挑战第26天】本文深入探讨了AI技术在文本生成领域的应用,并分析了其面临的挑战。通过介绍AI文本生成的基本原理、应用场景以及未来发展趋势,帮助读者全面了解该技术的潜力和局限性。同时,文章还提供了代码示例,展示了如何使用Python和相关库实现简单的文本生成模型。
34 9
|
5天前
|
机器学习/深度学习 人工智能 供应链
精准农业:AI在农业生产中的应用
【10月更文挑战第1天】随着科技的发展,人工智能(AI)逐渐渗透到农业领域,通过精准监控和管理提升了农业生产效率和质量。AI在精准农业中的应用包括:精准农田管理,如个性化灌溉和施肥;作物病虫害识别与预测,及时发现并预防病虫害;智能农机自动化作业,提高作业效率;农产品质量检测与分类,确保品质;农业供应链优化,预测需求和价格。尽管面临数据收集、技术接受度等挑战,AI在精准农业中的未来前景广阔,有望实现全程自动化作业、数据驱动决策及智能预警系统,推动农业可持续发展。
24 11

热门文章

最新文章

下一篇
无影云桌面