新冠病毒或致个人年内死亡率翻倍!哥大校友用机器学习飞速筛选抗体

简介: 新冠肺炎全球确诊超34万、死亡超1.4万。日前,Yann LeCun转发推文:感染COVID-19会使你在一年内的死亡几率翻倍。危急时刻,世卫组织对四种最有希望的新冠病毒治疗方法展开全球大规模试验,哥大数据科学研究所校友使用机器学习快速发现新冠病毒治疗方法。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

image

上周五,世界卫生组织宣布了一项名为“SOLIDARITY”的大型全球性试验,以寻找可以用于治疗新冠肺炎的药物。这项研究可能包括几十个国家的数千名患者,尽可能设计的简单,这样即使是涌入了大量COVID-19患者的医院也能参与进来。

科学家建议了数十种现有化合物进行测试,但世卫组织正聚焦在四种它认为最有希望的疗法上:一种称为瑞德西韦的实验性抗病毒化合物;疟疾药物氯喹和羟基氯喹;两种艾滋病毒药物的组合,洛匹那韦和利托那韦;洛匹那韦和利托那韦加上干扰素β。

关于COVID-19患者中使用这些药物的一些数据已经显示,HIV联合疗法在中国的一项小规模研究中失败了,但世卫组织认为,有必要对更多患者进行大规模试验。

除了测试已有的潜在药物,发现新的治疗方法也很有必要。

哥大数据科学研究所(DSI)校友使用机器学习快速发现新冠病毒治疗方法

哥伦比亚大学数据科学研究所(DSI)的两名毕业生正在通过计算设计来快速发现冠状病毒的治疗方法。

image

Andrew Satz和Brett Averso分别是EVQLV的首席执行官和首席技术官。EVQLV是一家初创公司,其创建的机器学习算法能够在短短几天内识别并筛选数亿种潜在的抗体治疗方法,这远远超出了任何实验室的能力。在实验室中发现和优化抗体平均需要五年半的时间,而该算法只需一周的时间即可识别病毒抗体。

image

寻找抗体是发现新冠病毒疗法的第一步。“我们的算法所要做的是减少实验室中药物发现失败的可能性。” Satz补充说:“我们尽可能在计算机模拟中试错,以减少下游实验室发生错误的可能性。这样可以从繁琐而费时的工作中节省大量的时间。”

Brett Averso介绍道,EVQLV设计的一些抗体旨在防止冠状病毒附着在人体上。“形状正确的抗体与位于人细胞和冠状病毒表面的蛋白质结合,就像锁和钥匙的关系。这种结合可以防止病毒在人体中扩散,从而可能限制疾病。”

EVQLV与专注于发现治疗性抗体的公司Immunoprecise Antibodies(IPA)合作。EVQLV在发现和优化抗体后,将有希望的抗体基因序列发送给其实验室合作伙伴。然后,IPA将对最有希望的候选抗体进行工程设计、制造和测试,该过程不再需要数年,而只需几个月。成功的抗体将用于动物研究,最后是人体研究。

考虑到国际上对抗冠状病毒的紧迫性,Satz表示,有可能在2020年底之前为患者准备好治疗方案。

在就读于DSI期间相识的Satz和Averso坚定致力于“数据向善”。两人在数据科学和医疗保健的交叉领域合作了多年,并于2019年12月成立了EVQLV,旨在使用AI技术来加快发现、发展和治愈健康问题的速度。该公司已经发展到12名团队成员,技术涵盖了机器学习和分子生物学,软件工程和抗体设计,云计算以及临床开发等领域。二人通常都每周工作100小时,因为他们对数据科学充满热情,并致力于以此“帮助医治有需要的人”。

Yann LeCun转发:感染COVID-19会使你在一年内的死亡几率翻倍

近日,深度学习大佬Yann LeCun在推特上转了统计学家David Speigelhalter的一个推文并评论道:若感染了COVID-19,其死亡概率约等于一年内任何其他原因的死亡概率。令人惊讶的是,无论年龄大小,都是如此。感染COVID-19会使你在一年内的死亡几率翻倍。

image

在Speigelhalter的博文中,他使用了英国国家统计局提供的生命表。由于先天性疾病和出生创伤,出生后有个死亡高峰,9、10岁是一个低谷,然后是稳定的线性增长。不管年龄多大,每年死亡的人口比例都以9%左右的速度增长。所以平均死亡风险在8年内翻倍。

image
国家统计局2016-2018年英格兰和威尔士的年度死亡风险

伦敦帝国学院研究人员的最新报告提供了对新冠病毒感染后死亡的特定年龄段风险的估计值,这些风险如下表所示。

image
不同年龄组感染COVID-19后的死亡率

如果将感染COVID-19后的死亡率叠加在上面的“生命表”上(绘制每10年中的第7年),结果如下图,可以看出,感染COVID-19后的死亡风险与正常死亡风险的趋势是一致的。

image

然后,将COVID-19风险与生命表中的死亡风险进行比较,得出相对风险,范围为0.5到2。

image

可以看出,感染COVID-19的死亡风险相当于一年内任何其他原因的死亡风险。用博主的话说“感染COVID-19就像将一年的风险打包到一两个星期一样”。

不过博主也指出,这两个群体将会有很大的重叠——许多死于COVID-19的人无论如何都会在短时间内死亡——因此这些风险不能简单地加在一起,也不能简单地将感染者的风险增加一倍。至关重要的是,国家医疗服务体系不能不堪重负,但如果像现在所建议的那样,通过严格的抑制措施,COVID死亡人数可以控制在20,000人左右,那么对2020年总体死亡率的影响可能很小(尽管由于卫生服务的压力和隔离的副作用,基础死亡率可能会增加)。不过,正如我们所看到的,代价是巨大的。

参考链接:
https://medium.com/wintoncentre/how-much-normal-risk-does-covid-represent-4539118e1196
https://www.technology.org/2020/03/22/dsi-alumni-use-machine-learning-to-discover-coronavirus-treatments/

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-03-23
本文作者:新智元
本文来自:“新智元”,了解相关信息可以关注“新智元

相关文章
|
2月前
|
机器学习/深度学习 数据采集 监控
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
75 0
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型(2)
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型
111 0
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型(1)
7 Papers & Radios | 联邦图机器学习综述;基于知识图谱和分子图的药物筛选模型
127 0
|
机器学习/深度学习 算法 安全
Nat. Mach. Intell.| 机器学习显著降低药物组合筛选成本
Nat. Mach. Intell.| 机器学习显著降低药物组合筛选成本
144 0
Nat. Mach. Intell.| 机器学习显著降低药物组合筛选成本
|
2月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
|
27天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
2月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
29 1
|
2月前
|
机器学习/深度学习 数据采集 算法
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
125 0
|
2月前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机(SVM)算法
【2月更文挑战第20天】 在数据科学与人工智能的领域中,支持向量机(SVM)是一种强大的监督学习算法,它基于统计学习理论中的VC维理论和结构风险最小化原理。本文将深入探讨SVM的核心概念、工作原理以及实际应用案例。我们将透过算法的数学原理,揭示如何利用SVM进行有效的数据分类与回归分析,并讨论其在处理非线性问题时的优势。通过本文,读者将对SVM有更深层次的理解,并能够在实践中应用这一算法解决复杂的数据问题。
21 0
|
2月前
|
机器学习/深度学习 分布式计算 算法
大模型开发:你如何确定使用哪种机器学习算法?
在大型机器学习模型开发中,选择算法是关键。首先,明确问题类型(如回归、分类、聚类等)。其次,考虑数据规模、特征数量和类型、分布和结构,以判断适合的算法。再者,评估性能要求(准确性、速度、可解释性)和资源限制(计算资源、内存)。同时,利用领域知识和正则化来选择模型。最后,通过实验验证和模型比较进行优化。此过程涉及迭代和业务需求的技术权衡。