谷歌与Verily发布新研究,可通过视网膜图像用AI检测心脏病

简介:
本文来自AI新媒体量子位(QbitAI)

心脏病是一种常见的高发疾病。传统的治疗方法通常依赖于心电图、超声、X射线等大型仪器,可能不久后,会有一种更简单的心脏病检测方法问世。

视网膜图像派上用场

这项成果来自谷歌和其母公司Alphabet旗下的生命科学公司Verily。

在昨天发表的论文《Predicting Cardiovascular Risk Factors from Retinal Fundus Photographs using Deep Learning》中,他们展示了一种能在视网膜图像中发现心脏病风险的新研究。

这种方法对身体的侵入性较小、获取容易,并且还能用AI快速分析结果。

虽然目前医学界可通过部分身体表象判断患者是否患病,但谷歌和Verily算法能够自己分析患者年龄、性别、吸烟史、血压、血糖等相关信息。通过AI分析特征对心血管产生影响评估心脏衰竭的概率。

研究人员表示,该研究测试结果与欧洲心血管手术危险因素评分系统(SCORE )检测结果基本一致。

论文摘要

一般来说,医学研究从关联研究开始,然后设计实验验证假设。然而,图像中的特征、模式、颜色、数值、形状在现实情况下通常信息量很大,因此观察并量化关联非常困难。

在这篇论文中,我们用深度学习的方法学习特征,从视网膜图像中找到需要的信息,之后用284335名患者上收集的信息训练模型,并用12026和999名患者的两组信息作为验证数据集。

我们在视网膜图像上预测以前认为并不存在或不可量化的心血管风险隐患,如年龄、性别(0.97 AUC)、吸烟状况(0.71 AUC),HbA1c(1.39%以内),心脏收缩压(11.23 mmHg以内)及主要心脏患病史(0.70 AUC)。

最后,我们从视神经盘、血管等入手,分布展示了每个预测的生成过程。

检测结果

论文结尾,研究人员给出了系统预测的结果与真实情况的对照信息。我们可以看到,通过AI分析视网膜的结果,与真实情况大致相同。

样本中患者预测年龄57.6岁,实际年龄59.1岁。预测患者为一名不吸烟且无糖尿病的女性,与真实情况相符。患者的身高体重指数(BMI)为26.3千克/每平方米,实际为24.1千克/每平方米,两者相差不大。心脏实际收缩压与舒张压分别为148.5mmHg与78.5mmHg,AI预测结果为148.0mmHg与86.6mmHg。

 AI检测结果与实际情况对比

尚不可用

虽然谷歌称其测试与SCORE测试结果相当,但论文中没有与标准等价测试结果的对比说明,所以目前无法确定AI是否真的像医生一样好。同时,这一研究目前还没有进行同行评审。

研究人员也表示,虽然谷歌与Verily收集了近30万人的数据,但这些数据集中白人和西班牙裔患者的信息。研究人员在论文提醒,虽然系统检测效果良好,但对于AI来说30万的数据集仍然很小,需要进一步测试。

最后,附研究论文地址:

https://arxiv.org/abs/1708.09843v1

本文作者:安妮 
原文发布时间:2017-09-02 
相关文章
|
1天前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
20 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
130 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
16天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
64 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
21天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
123 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
14天前
|
存储 人工智能 安全
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
|
5天前
|
机器学习/深度学习 人工智能 安全
阿里云先知安全沙龙(武汉站) ——AI赋能软件漏洞检测,机遇, 挑战与展望
本文介绍了漏洞检测的发展历程、现状及未来展望。2023年全球披露的漏洞数量达26447个,同比增长5.2%,其中超过7000个具有利用代码,115个已被广泛利用,涉及多个知名软件和系统。文章探讨了从人工审计到AI技术的应用,强调了数据集质量对模型性能的重要性,并展示了不同检测模型的工作原理与实现方法。此外,还讨论了对抗攻击对模型的影响及提高模型可解释性的多种方法,展望了未来通过任务大模型实现自动化漏洞检测与修复的趋势。
|
24天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
66 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
58 25
|
20天前
|
人工智能 自然语言处理 API
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口,能够处理文本、音频和视频输入,提供自然流畅的对话体验,适用于多种应用场景。
67 3
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
|
10天前
|
人工智能 安全 图形学
【AI落地应用实战】篡改检测技术前沿探索——从基于检测分割到大模型
在数字化洪流席卷全球的当下,视觉内容已成为信息交流与传播的核心媒介,然而,随着PS技术和AIGC技术的飞速发展,图像篡改给视觉内容安全带来了前所未有的挑战。 本文将探讨篡改检测技术的现实挑战,分享篡改检测技术前沿和最新应用成果。