通过几分钟录音就能判断得没得新冠,AI 还可以这样?

简介: 人工智能技术正在通过声音来探索其释放的情绪信息。

当代年轻人习惯把「emo」当口头禅挂在嘴边,而忽略了真正的「抑郁」代表什么。假如人的情绪也有「值」,那么如何让情绪测试能像测量体温、血压一样简单?

人工智能技术正在通过声音来探索其释放的情绪信息,比如杨紫主演的《女心理师》有一幕场景是 AI 系统分析/干预来电者的自杀倾向。从呼吸系统疾病到帕金森病、慢性老年病这类生理疾病,以及抑郁症、产后抑郁、认知障碍和脑震荡等精神疾病,这些正是 AI 的探索方向——「语音生物标志物」(Vocal Biomarker)。

IT 桔子注意到近日一则「AI 通过声音来诊断新冠」相关的重磅新闻:美国辉瑞公司(Pfizer)已同意以每股 0.115 澳元、总价 1 亿澳元的价格收购 ResApp 股票,但交易仍需法院和股东的批准。ResAPP 目前开发了一款通过分析咳嗽声来诊断是否感染新冠病毒的应用程序。

追本溯源,说到通过听患者的声音来辅助医生判断病情这件事一点也不奇怪,中医自古强调的「望闻问切」中的「闻」就是指听声音、气息;现代医学领域中的听诊器更是发布于 1819 年。可见,除了影像数据,声音数据也是医学范畴内的必要的医疗数据。不过,不同于传统就医方式下的面诊、医生判断,人工智能加持下的医学使得远程医疗、机器诊断成为可能。在新冠疫情大爆发、全球医疗资源紧张的今天,这种方式或是得以解「燃眉之急」。

本文着眼于科普,并能简要回答以下四个问题:

  • AI 语音识别筛查新冠病毒和抑郁症是如何实现的?
  • 辉瑞制药拟收购的 ResApp 这家公司有何特殊之处?
  • 全球范围内获得投资的同类公司还有哪些?
  • 国内公司在这方面进行了什么样的尝试探索?

通过语音判断是否感染病毒是如何实现的
通过声音检测新冠病毒感染靠谱吗?要回到这个问题,需要回归科学层面。研究表明,人体发声时会产生相应的生物标记物,当身体出现健康问题时,疾病的特异性干扰会对人体某个系统或多个系统产生细微、肉眼难以察觉、但具有特性的变化,生物标记物含量由此产生变化。而这种变化,可以利用机器来进行检测和分析计算。

其实,相比 AI 语音识别是否感染近 2 年才出现的新冠病毒,AI 更早之前还被运用于判断和识别 PTSD(创伤后应激障碍)、抑郁症以及其他心理疾病。比如,抑郁症患者往往会表现出言语迟缓、音量不稳定、发声颤抖、语言韵律异常等症状。

2015 年,纽约大学 Langone 医学中心的研究人员使用神经网络发现了 30 种语音特征,比如,机器学习算法显示,在 250 多名患有创伤后应激障碍的个体中,发音中的元音间隔明显缩短等。这些特征可能区分出创伤后应激障碍的退伍军人和未受影响的退伍军人(或健康对照组),这个方法被用于一项为期 5 年的前瞻性大型队列研究。在开发的早期阶段,研究人员就发现该系统可以诊断 PTSD 的准确性为 77%。

那么,继听声辅助心理诊断后,AI 在通过声音来判断是否感染新冠病毒也有了用武之地。

卡内基梅隆大学(CMU)一支研究团队长期致力于语音取证技术的研究,他们研究发现人的声音受到器官机构状况和健康程度的影响,能揭示生理/心理甚至医学数据。受新冠肺炎病毒感染的患者,肺部会发生一些病变,其呼吸模式等参数会受到影响,导致发出的声音(呼吸间隔、咳嗽声等)出现一些异常特征,算法通过学习数据能够抓取识别出这些病症。

827576737f696b5adb2699587fb3cc59bd8b17.png

时频谱示意图

早在 2020 年 4 月,卡内基梅隆大学就发布过简易的测试程序 COVID Voice Detector 中,受试者需要填写个人健康相关信息,并录制咳嗽、英文元音的发音,数字和字母表朗读等语音信息。系统最后会返回一个分数,表明所录制的声音和收集到的 COVID-19 患者数据相比,其感染特征相符合的程度。

整个过程的实现是需要经过前期数据采集,中期的构建数据分析模型、机器学习,到后期的数据采样、数据匹配与结果反馈。

首先,研究者需要采集到新冠阳性确诊者和阴性人群的大量录音测试数据,然后将这些语音生物标志物生成频谱图;机器模型经过训练和学习来感知和分析其中的细微变化;在最后的应用期,人工智能将用户提交的录音与基于临床试验中 COVID-19 阳性参与者的录音的合成图像进行比较,以确定它们之间的相关性。最后,机器反馈输出一个结果。

所以,机器识别的准确率很大程度上取决于数据信息的丰富度,当训练的样本数据足够多,足够丰富,机器判断的准确率也能提高。

ResApp 表示,在印度和美国对 741 名患者进行的临床试验中,该算法正确地检测出了 92% 的新冠病毒感染者。ResAppDx 目前在欧洲通过了 CE 市场认证,在澳大利亚获得了 TGA 许可批准。

值得注意的是,应用程序筛查并不能完全代替临床医生的诊断,但可用作 COVID-19 的早期预警,或者说是筛查,而不是诊断。ResAPP 方面也表示,「其设计的流程是如果检测结果并没有感染那么就无需做快速抗原测试或者 PCR 检测,但如果程序诊断感染了新冠病毒,那么人们就应该继续正常的检测。」

ResApp 是一家什么样的公司
通过 Google 搜索和官网公开信息,我们发现 ResApp Health 是一家「重生」的新公司——ResApp Diagnostics 通过反向收购 2005 年在澳大利亚证券交易所上市的生物公司 Narhex Life Sciences 实现上市,2014 年双方组建了 ResApp Health,公司总部位于澳大利亚布里斯班。其背后核心团队成员背景也比较多元:非执行主席 Roger Aston 博士具有生物学背景,在多家大型制药公司董事会任职;CEO、总经理 Tony Keatin 拥有昆士兰大学的机械工程博士学位(Ph.D.),创业前曾在 UniQuest 工作,主要负责技术商业化方面;联合创始人 Brian Leedman 是一位连续创业者,曾创办多家医疗公司,主要负责营销和投资者关系。

ResApp 专注于提供呼吸道疾病领域的数字化诊断筛查服务——利用机器学习算法分析咳嗽声对哮喘,肺炎和毛细支气管炎等疾病进行判断。这种服务既可以集成在远程医疗解决方案系统中为医生提供便利,也可以运行在独立的 APP 中面向患者使用。

ResApp 公司旗下有三大产品体系,分别应用于急性呼吸疾病诊断、慢性呼吸疾病管理和睡眠健康管理领域。值得一提的是,睡眠健康管理主要是帮助具有睡眠呼吸障碍的人群。ResApp 开发了一种阻塞性睡眠呼吸暂停筛查测试程序,通过床头的智能手机来记录夜间呼吸和打鼾声以识别阻塞性睡眠呼吸暂停 (OSA)。传统方式的睡眠呼吸暂停诊断需要在实验室使用多个传感器,进而生成多导睡眠图 (PSG),而 AI 分析检测的方式几乎「无感知」,将对人体的干扰降为最低。

21df9918767ae0fb2bc77606b93900ef518775.png

图片来源 ResApp 官网,经谷歌翻译

另外,ResApp 近期开发了一款通过听咳嗽声音判断是否感染新冠病毒的 APP,并声称其 APP 新冠检测准确率「已经超过了快速抗原测试的实际准确率」。ResApp 还表示,除了表示收购意向外,辉瑞与公司宣布将就新冠病毒问题签订研发许可协议。

目前 ResApp 在澳交所的股价为 0.11 澳元,总市值约 1 亿澳元;同时,还在美股 OTC(场外柜台交易)板块可交易。

像这样分析声音的 AI 医疗公司还有哪些

致力于语音生物标志物」(Vocal Biomarker)研究的商业公司都有谁呢?可参见下表:

189dac18731d9f5ca5a058e1ffb29c68073780.jpg

除了上文说到的 ResApp,IT 桔子观察到全球范围内另有其他一些使用声音做诊断的公司获得了融资。比如美国抑郁症诊断语音分析领域的 Ellipsis Health 完成了 2600 万美元 A 轮融资,加拿大 AI 语音诊断技术研发商 Winterlight Labs,以及专注识别焦虑和抑郁等疾病的美国初创公司 Kintsugi 在近半年内分别完成 800 万美元的种子轮融资和 2000 万美元的 A 轮融资。

还有两家以色列健康科技公司 Beyond Verbal 和 Healthymize 合并设立的 Vocalis Health 在 2019 年底获得了以色列健康技术和生命科学风险投资公司 Amoon 牵头的 900 万美元融资。在 2021 年 2 月,Vocalis 宣布其 COVID-19 筛查工具 Vocalis Check 在大型临床研究中成功验证,并已获得 CE 标志,成为首个获得 CE 批准的新冠筛查医疗设备。

以上公司虽然可能是语音生物标志物」领域部分获投公司,但不管从布局的资方数量上看,还是公司所获融资阶段等各方面来看,这个细分市场是一个很前沿的赛道,目前还非常早期,商业化落地短期内更是无望。尤其是在国内,虽然国内在智能语音领域拥有不少成熟的头部 AI 公司,但无论是老牌的科大讯飞,还是新秀的云知声、思必驰,目前还没有公开可行的 AI 语音生物标志物产品/方案。不过国内也有两家初创公司曾经或正在探索这个方向。

想象科技成立于 2014 年,提供语音情感分析与心理测评服务;尝试过社交方向。2017 年专注「情绪体检」的 Wonder AI Lab 成立,探索 AI+心理健康的可能性。其感知 AI 模型通过实时识别个人情绪,再综合心理、精神疾病等多学科知识交叉运用,基于 EQ 专家所标记的 350 多万个情感音频数据,最后应用到智能语音心理健康平台上。

科慧健远成立于 2019 年,在某次创业大赛中展示了其研发的一款儿童语言发育障碍 AI 病理机器人,利用 AI 人脸识别技术、眼线眼动数据分析技术、病理语音数字分析技术、自闭症及语言相关障碍筛查系统,对语言发育迟缓、儿童构音障碍、自闭症、语言发育迟缓等疾病进行筛查和识别。不过,该项目是否真正落地和推向市场,暂不得而知。

AI 加持下的普惠、个性化医疗让现代医学诊断不再止步于临床应用,而是走进千家万户,更加便利可取。这条道路虽任重而道远,但其价值无限,亦值得出发。


本文转载自51CTO,本文一切观点和机器智能技术圈子无关。原文链接
免费体验百种AI能力以及试用热门离线SDK:【点此跳转】

相关文章
|
人工智能 安全 数据安全/隐私保护
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
197 0
|
机器学习/深度学习 人工智能 安全
告别捅嗓子?AI手机程序通过声音检测新冠,准确率已达到89%
大数据文摘出品 不知道大家对做核酸怎么看,反正文摘菌的喉咙已经起茧了
231 0
告别捅嗓子?AI手机程序通过声音检测新冠,准确率已达到89%
|
机器学习/深度学习 存储 人工智能
手机借助AI闻“声”辨新冠
一项研究,人工智能(AI)可通过手机应用程序从人们声音中检测出新冠肺炎感染,它比快速抗原测试更准确(达到89%),且更便宜、快速和易于使用。
手机借助AI闻“声”辨新冠
|
人工智能 安全 数据安全/隐私保护
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
208 0
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
|
机器学习/深度学习 人工智能 自然语言处理
一周AI最火论文 | 新冠病毒数据开源,Kaggle发布新冠病毒挑战赛
一周AI最火论文 | 新冠病毒数据开源,Kaggle发布新冠病毒挑战赛
487 0
|
人工智能 编解码 自然语言处理
助力新冠CT检测,依图4天上线AI系统!准确率达97.3%,已服务数万人
助力新冠CT检测,依图4天上线AI系统!准确率达97.3%,已服务数万人
261 0
|
机器学习/深度学习 人工智能 算法
中国研究者开发AI系统,平均3秒内识别新冠肺炎和普通感冒
秋冬季节也是其他呼吸道疾病的高发期,这让新冠肺炎的鉴别、诊断和治疗变得更加困难。近期,《自然》子刊《自然通讯》发布的论文显示,中国研究员已开发一种基于深度学习的人工智能系统,可用来快速地区分新冠肺炎和其他呼吸道疾病。
4363 0
中国研究者开发AI系统,平均3秒内识别新冠肺炎和普通感冒
|
机器学习/深度学习 存储 人工智能
阿里云为新冠AI辅助诊断系统加速
阿里云为此次新冠肺炎AI诊断系统的部署提供了全球加速解决方案,通过全球加速GA产品,依托阿里巴巴遍布全球的优质传输网络,可以有效提升全球数据访问的稳定性。
573 0
阿里云为新冠AI辅助诊断系统加速
|
机器学习/深度学习 存储 人工智能
全球CT影像20秒诊断,阿里云为新冠AI辅助诊断系统加速
诊断一位新冠肺炎患者,医生肉眼要阅读数百幅CT影像,花费15-20分钟时间,而通过新冠病毒AI辅助诊断系统,只需要20S。阿里云网络帮助澳门科技大学及科研团队,成功在云上部署AI辅助诊断系统,通过科技抗击疫情
1395 0
全球CT影像20秒诊断,阿里云为新冠AI辅助诊断系统加速
|
人工智能 达摩院 机器人
达摩院 AI 进入中国科技馆,首张 AI 识别新冠 CT 成科技抗疫历史见证
5 月 29 日消息,全国科技工作者日来临之际,一个特别的藏品入选中国科技馆“2020 数字馆藏”——阿里巴巴达摩院 AI 识别标注的第一张新冠肺炎 CT 影像。达摩院AI作为科技抗疫的历史见证,被写入中国科技发展史。
1184 0
达摩院 AI 进入中国科技馆,首张 AI 识别新冠 CT 成科技抗疫历史见证

热门文章

最新文章