寻找新冠致重症因素,如何通过云计算将分析时间缩短80%以上?

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 阿里云高性能计算团队协助中山大学使用阿里云高性能计算服务进行生物信息科学计算,在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上缩减到了 2 个小时,大大提高了工作效率。

国内疫情稍有缓和,但公共科研机构与病毒间的战争从未停止。科研人员与医疗工作者们依然在日以继夜地研究着这名“对手”,追溯它从何而来、如何“作恶”,我们又能如何消灭它。科技早已作为科研人员的后盾,他们背后有无数的计算力在为分析病毒而跳动着。

在这些与病毒持续搏斗的科研机构中,就有中山大学医学院,这也是疫情期间阿里云提供免费算力支持的机构之一。

中大医学院尝试寻找致重症的因素

在国内疫情肆虐之际,中山大学医学院通过与多家医院、疾控中心等合作,计划获取超过千名武汉市新冠患者的核酸样本,以及部分病人的全病程数据,希望通过基因组测序及测序数据分析,阐述冠状病毒的起源、进化和致重症机制。

image.png

中山大学医学院施莽老师解释,研究人员主要是从病原体本身、微环境(与病原体共感染的细菌 / 微生物),及宿主即人类的免疫系统三个方面的角度去寻找引发重症的因素。

中山大学医学院使用宏转录组的方法,期望从中原始样本中挖掘得到所有关键的遗传信息。科学家们通过分析这些遗传信息重现病原体感染、宿主免疫和机体内环境相互作用的动态过程,寻找导致机体重症的关键因素。

只有全面了解了重症因素,才可以在临床上进行重症预警,医生可以及早干预,对症下药;并指导缓解和预防重症的药物研发。

此外,科学家会将分析后的临床信息、病毒信息、基因组信息和实验结果数据汇总,构建新冠感染相关大数据,帮助研究病毒起源,也方便后续研究。

阿里云 EHPC,让数据分析性能提升 25%

在研究过程中,科学家首先需要通过高通量基因测序平台,对原始样本进行测序,获得样本中包括病毒、细菌和宿主的完整遗传信息。但这些信息仅是片段化的信息,需要进一步的生物信息学分析(包括序列的拼接和注释)才能解读采样的时间点病人体内正在发生的重要生命过程。

image.png

从基因测序到获得全基因组信息的过程

遗传信息的拼装和比对需要高性能计算进行处理,海量的数据更是需要大规模算力。

本次实验处理的病例超过 1000 人,一般病例至少采集两份数据,单份数据就有 2-3G,部分病例为了采集全病程数据还采样数十次,还要再加上对照组信息。同时,中山大学的科学家还需要下载美国国家生物信息中心 NCBI(National Center for Biotechnology Information)中的约 8000 个样品进行比对,其产生的数据之海量可想而知。

在分秒必争的疫情背景下,云上高性能计算的优势凸显,可加快研究进程。

阿里云帮助中山大学整合了从原始数据到获得最后分析结果的完整计算流程,云服务的弹性能够在短时间内快速交付丰富的算力资源, 通过阿里云高性能计算(EHPC)一键部署超算集群环境,根据需求动态增减集群节点,免去了研究人员们针对服务器的管理和维护,不需要在运维上耗费过多精力,只需专注在研究上。

同时,阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25% 以上。

在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上缩减到了 2 个小时。原本需要 1 年的运算量缩减到了约 2 个月时间,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。

相关文章
|
28天前
|
人工智能 Cloud Native 安全
未来云计算发展趋势及挑战分析
随着数字化时代的快速发展,云计算作为一种重要的信息技术基础设施,正扮演着越来越关键的角色。本文将探讨未来云计算的发展趋势和面临的挑战,为读者带来对云计算技术的深入了解和前瞻性思考。
|
2月前
|
机器学习/深度学习 边缘计算 云计算
未来云计算发展趋势分析
【2月更文挑战第6天】 云计算作为当今信息技术领域的热门话题,其在未来的发展趋势备受关注。本文将探讨未来云计算发展的方向和趋势,从技术、应用和安全等多个角度进行分析,旨在帮助读者更好地了解云计算领域的发展动向。
|
7月前
|
网络协议 关系型数据库 数据库
云计算比赛赛项分析(一)
云计算比赛赛项分析(一)
302 1
|
4月前
|
消息中间件 大数据 Apache
【云计算与大数据技术】流计算讲解及集群日志文件实时分析实战(附源码)
【云计算与大数据技术】流计算讲解及集群日志文件实时分析实战(附源码)
49 1
|
7月前
|
弹性计算 负载均衡 网络协议
云计算比赛赛项分析(三)
云计算比赛赛项分析(三)
102 1
|
7月前
|
关系型数据库 Java PHP
云计算比赛赛项分析(二)
云计算比赛赛项分析(二)
107 1
|
11月前
|
监控 安全 云计算
在线教育行业云上技术服务白皮书-在线教育新模式下对云计算的需求与教育智能硬件-教育智能硬件与使用场景分析
在线教育行业云上技术服务白皮书-在线教育新模式下对云计算的需求与教育智能硬件-教育智能硬件与使用场景分析
140 0
|
存储 机器学习/深度学习 弹性计算
云计算案例分析| 学习笔记
快速学习云计算案例分析
305 0
云计算案例分析| 学习笔记
|
JavaScript 前端开发 云计算
PIE-engine 教程 ——云计算当中的list列表案例分析(for循环list)
PIE-engine 教程 ——云计算当中的list列表案例分析(for循环list)
114 0
PIE-engine 教程 ——云计算当中的list列表案例分析(for循环list)
|
云计算
PIE-engine 教程 ——云计算当中的map()映射函数list列表映射案例分析
PIE-engine 教程 ——云计算当中的map()映射函数list列表映射案例分析
94 0
PIE-engine 教程 ——云计算当中的map()映射函数list列表映射案例分析