MIT新研究:AI仅靠看X光片就能准确识别患者种族,但没人知道为什么

简介: MIT新研究:AI仅靠看X光片就能准确识别患者种族,但没人知道为什么

图片.png

大数据文摘作品作者:Mickey 


人类对于某人是黑人、亚洲人还是白人的判断主要来自于某些外貌特征:皮肤、头发、眼睛这类外在体征,但是,如果仅从一个人的胸部X光片、肢体CT扫描和乳房X光片等影像资料,就能判断出他/她的种族,你相信吗? 


当然不,毕竟连最专业的医学影像专家都无法识别。不过最近,根据麻省理工学院的一项研究,经过训练的人工智能可以有效识别这些没有被标注的X光片的主人,到底是黑人、黄种人还是白人,准确率达到90%以上,即使这些图像是损坏、裁剪和噪声的医学影像,而这一点通常是临床专家无法做到的。


 并且,研究者们强调,这一识别结果不是由于某些已知与族裔相关的身体特征关联导致的(例如通过体重指数 [AUC 0·55]、疾病分布 [0·61] 和乳房密度 [ 0·61]等等)。 


这一研究结果目前发布在《柳叶刀数字健康(Lancet Digit Health)》上。

图片.png


AI能通过胸片识别患者种族?“我以为我的学生疯了”

 AI模型在医学影像识别领域的能力早已有目共睹,但是麻省理工这一研究之所以引发了极大的关注,一方面是由于其高精度识别率背后的原因仍是个“黑盒”,另一方面,研究者们也不得不担忧,人工智能是否早已经将“种族偏见”融入了人类从未想到的方方面面。 


在麻省理工的这一研究中,研究者们了使用私人(Emory CXR、Emory 胸部 CT、Emory 颈椎和 Emory 乳房 X 线照片)和公共(MIMIC-CXR、CheXpert、国家肺癌筛查试验、RSNA 肺栓塞 CT 和数字手部图谱)数据集。该团队发现被训练过的人工智能可以仅从这些医学图像中,高准确率地预测患者自我报告的种族。


 利用胸部 X 光片、肢体 X 光片、胸部 CT 扫描和乳房 X 光片的成像数据,该团队训练了一个深度学习模型来识别图像的主人是白人、黑人还是亚洲人——尽管这些图像本身并没有明确提及病人的种族。 

图片.png

  目前,即使是最有经验的医生也无法做到这一点,并且也尚不清楚该模型是如何做到的。


  “当我的研究生向我展示这篇论文中的一些结果时,我认为这肯定是一个错误,”麻省理工学院电气工程和计算机科学助理教授、该论文的合著者Marzyeh Ghassemi说,“我真的以为我的学生疯了。”


 为了梳理和弄清这一切的神奇的识别系统是如何实现的,研究人员进行了一系列实验。为了研究种族检测的可能机制,他们研究了诸如解剖结构差异、骨密度、图像分辨率等变量。但是,抛开这些变量后,AI仍然具有通过胸部 X 光检测种族的高能力。 


该团队尝试了很多方式,试图解释AI是如何识别的:不同种族群体之间身体特征的差异(体质、乳房密度)、疾病分布(之前的研究表明,黑人患者患心脏病等健康问题的几率更高) )、特定位置或特定组织的差异、社会偏见和环境压力的影响、深度学习系统在多种人口统计和患者因素结合时检测种族的能力,以及特定图像区域是否有助于识别种族。  


例如,骨密度测试使用的图像中,骨较厚的部分呈白色,较薄的部分呈灰色或半透明。科学家们认为,由于黑人通常具有较高的骨矿物质密度,因此颜色差异有助于人工智能模型检测种族。为了切断这一点,他们用过滤器调整了图像,这样模型就不会出现颜色差异。事实证明,调整影像颜色并没有扰乱模型——它仍然可以准确地预测种族。(“曲线下面积”值,即定量诊断测试准确性的衡量标准,为 0.94–0.96)。因此,模型的学习特征似乎依赖于图像的区域。


  “这些结果最初令人困惑,因为我们研究团队无法为这项任务找到一个好的解释,”Marzyeh Ghassemi 表示,“即使将这些医学图像调整到已经不能被称为医学图像的样子,深度模型的识别正确率仍能保持非常高的性能。” 


防不胜防的AI偏见

 但这一结果也令研究者们颇为忧虑。 


算法的错误训练会导致偏见,这一点毋庸置疑,而当人工智能反映了产生这些算法的人类的无意识思想、种族主义和偏见时,它可能会导致严重的伤害。

图片.png


 “这令人担忧,因为AI超人的能力通常更难以控制、规范和防止伤害他人。”


 在临床环境中,算法识别可以帮助医生判断患者是否适合化疗,决定患者的分类,或决定是否需要转入 ICU。“我们认为算法只关注生命体征或实验室测试,但这一研究结果表明,它们也有可能关注你的种族、民族、性别,即使所有这些信息都被隐藏了,”论文合著者、麻省理工学院 IMES 首席研究科学家、哈佛医学院医学副教授 Leo Anthony Celi 说。“仅仅因为你的算法中有不同群体的代表,这并不能保证它不会延续或放大现有的差异和不平等。为算法提供更多具有代表性的数据并不是万能的。


 以往在其他领域的相关案例数不胜数,例如,计算机程序错误地标记了黑人被告再次犯罪的可能性是白人被告的两倍。当人工智能使用成本作为健康需求的判断因素时,它会将黑人患者识别为比同样患病的白人患者更健康,这样可以使得花在他们身上的钱更少。自然语言处理中存在偏见的例子是无穷无尽的,甚至 AI 过去写剧本也依赖于使用有害的刻板印象来进行选角。

图片.png


 但麻省理工学院的科学家们的研究发现了另一种重要的、很大程度上未被充分探索的模式:医学图像。


 值得注意的是,Ghassemi 和 Celi 的其他研究成果还发现,模型还可以从临床记录中识别患者自我报告的种族,即使这些记录被删去了明确的种族指标,而人类专家也无法从相同的临床记录编辑中准确预测患者种族。


 “我们需要让社会科学家参与进来,只有是临床医生、公共卫生从业者、计算机科学家和工程师是不够的。医疗保健是一个社会文化问题,就像它是一个医学问题一样。我们需要另一组专家来权衡并就我们如何设计、开发、部署和评估这些算法提供意见和反馈,”Celi 说。


 “我们还需要询问数据科学家,在对数据进行任何探索之前,是否存在差异?哪些患者群体被边缘化?这些差异的驱动因素是什么?是否可以获得护理?是来自护理提供者的主观性吗?如果我们不理解这一点,我们将没有机会识别算法肯带来的意外后果。” 


“正如研究所展示,算法‘看到种族的事实可能很危险。但一个重要且相关的事实是,如果谨慎使用,算法也可以消除偏见,”加州大学伯克利分校副教授 Ziad Obermeyer 说,他的研究重点是人工智能应用于健康。“在我们自己的工作中,我们也发现从患者疼痛经历中学习的算法可以在 X 射线中发现新的膝关节疼痛源,这些源头对黑人患者的影响尤其严重,而放射科医师也严重忽视了这些原因。因此,就像任何工具一样,算法既可以是邪恶的力量,也可以是善良的力量——这取决于我们,以及我们在构建算法时所做的选择。”


素材来源:

https://news.mit.edu/2022/artificial-intelligence-predicts-patients-race-from-medical-images-0520

https://pubmed.ncbi.nlm.nih.gov/35568690/

相关文章
|
14天前
|
人工智能 算法 程序员
程序员为何容易爱上AI?MIT学者诊断:智性恋浓度过高!
【9月更文挑战第20天】近日,一篇由MIT学者撰写的论文在网络上引发热议,探讨了程序员为何易对AI产生深厚情感,即“智性恋”。论文指出,程序员在开发和使用AI时,因对其智能和能力的钦佩而形成依赖与认同,但这可能导致过度依赖AI,忽视自身价值或其局限性,甚至引发不健康的竞争。论文链接:https://arxiv.org/pdf/2407.14933。
30 5
|
26天前
|
人工智能 安全 API
AI数据荒雪上加霜!MIT:网页数据的公开共享正走向衰落
【9月更文挑战第7天】麻省理工学院的一项新研究表明,尽管人工智能(AI)领域迅速发展,但网页数据的公开共享正在减少,加剧了AI数据短缺的问题。AI模型训练依赖大量数据,而网页数据是关键来源之一,其共享减少将影响AI进步,并引发数据隐私和安全方面的担忧。然而,这也推动了对数据隐私保护的关注及新型数据获取方式的探索。研究详情参见:[论文链接](https://www.dataprovenance.org/consent-in-crisis-paper)。
60 9
|
7天前
|
存储 人工智能 JavaScript
根据Accenture的研究,CEO和CFO谈论AI和GenAI是有原因的
数字化转型与当前GenAI领导者之间的关键区别在于,CEO和CFO(而非CIO)似乎参与了指导AI投资的过程。例如,Accenture在2024年1月报告称,到2023年底,在财报电话会议中提到AI的次数几乎达到4万次,因为C级领导层正在为“重大技术变革”做好准备
15 0
|
1月前
|
机器学习/深度学习 人工智能
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【9月更文挑战第1天】麻省理工学院(MIT)研究人员开发的深度学习AI模型,在乳腺癌早期预警方面取得突破性进展,相比传统方法提前5年预警癌症,准确率超过90%。此成果不仅在医学界引起轰动,还获得了人工智能领域知名学者Yann LeCun的高度评价。尽管面临准确性和可解释性的挑战,但该研究展示了AI在医疗领域的巨大潜力,有望革新乳腺癌的早期筛查和诊断方式。论文详情见[链接]。
30 3
|
2月前
|
边缘计算 人工智能 监控
边缘计算与AI结合的场景案例研究
【8月更文第17天】随着物联网(IoT)设备数量的爆炸性增长,对实时数据处理的需求也随之增加。传统的云计算模型在处理这些数据时可能会遇到延迟问题,尤其是在需要即时响应的应用中。边缘计算作为一种新兴的技术趋势,旨在通过将计算资源更靠近数据源来解决这个问题。本文将探讨如何将人工智能(AI)技术与边缘计算结合,以实现高效的实时数据分析和决策制定。
97 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
3D智能导诊系统源码,基于AI引擎,针对患者的病情及症状,结合性别年龄特征,智能推荐医院科室
智能导诊系统是一款基于AI技术的医疗辅助工具,利用自然语言处理和机器学习分析患者病情,精准推荐科室和医生。系统支持按性别分类导诊,设有3D人体模型辅助定位症状,界面简洁易操作。采用B/S架构,可无缝对接HIS数据库,支持多种接入形式,包括公众号、小程序和App,有效提升就诊效率并减轻医护人员负担。
|
3月前
|
数据采集 机器学习/深度学习 人工智能
AI小分子药物发现的百科全书,康奈尔、剑桥、EPFL等研究者综述登Nature子刊
【7月更文挑战第12天】康奈尔、剑桥及EPFL科学家合作,详述AI在药物发现中的突破与挑战[^1]。AI现用于新化合物生成、现有药物优化及再利用,加速研发进程。尽管取得进展,可解释性不足、数据质量和伦理监管仍是待解难题。 [^1]: [论文链接](https://www.nature.com/articles/s42256-024-00843-5)
40 3
|
4月前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在情感识别方面有哪些具体应用
AI在元宇宙学习中扮演关键角色,通过数据收集分析用户习惯、兴趣,提供个性化推荐。情感识别调整教学策略,智能评估反馈学习效果,实时互动解答问题,自适应学习系统匹配个体需求。同时,注重隐私安全保护,打造高效、精准、个性化的学习环境。
|
7天前
|
机器学习/深度学习 数据采集 人工智能
探索AI技术在文本生成中的应用与挑战
【9月更文挑战第26天】本文深入探讨了AI技术在文本生成领域的应用,并分析了其面临的挑战。通过介绍AI文本生成的基本原理、应用场景以及未来发展趋势,帮助读者全面了解该技术的潜力和局限性。同时,文章还提供了代码示例,展示了如何使用Python和相关库实现简单的文本生成模型。
30 9
|
3天前
|
机器学习/深度学习 人工智能 供应链
精准农业:AI在农业生产中的应用
【10月更文挑战第1天】随着科技的发展,人工智能(AI)逐渐渗透到农业领域,通过精准监控和管理提升了农业生产效率和质量。AI在精准农业中的应用包括:精准农田管理,如个性化灌溉和施肥;作物病虫害识别与预测,及时发现并预防病虫害;智能农机自动化作业,提高作业效率;农产品质量检测与分类,确保品质;农业供应链优化,预测需求和价格。尽管面临数据收集、技术接受度等挑战,AI在精准农业中的未来前景广阔,有望实现全程自动化作业、数据驱动决策及智能预警系统,推动农业可持续发展。
22 11

热门文章

最新文章

下一篇
无影云桌面