基于阿里云混合云架构的华大基因的BGIOnline,让基因检测从千年到21小时

简介: 华大基因、阿里云和安徽医科大学在深圳、杭州、合肥共同宣布,基于华大基因开发的新一代基因元计算平台BGIOnline,在21小时47分12秒内完成了1000例人类全外显子组数据的分析。”40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。
【云栖社区】在接到华大基因的感谢信之后,4月22日,阿里云总裁胡晓明发出全员信:我们在践行阿里云的使命——计算,为了无法计算的价值。

下述报道来自新浪微博:《基因检测“进化史”:从千年到一天》。


21小时47分12秒,这组数据被定格为了千人全基因测序的“中国速度”。

4月20日,来自“华大基因”的公号发出了一则消息:“华大基因、阿里云和安徽医科大学在深圳、杭州、合肥共同宣布,基于华大基因开发的新一代基因元计算平台BGIOnline,在21小时47分12秒内完成了1000例人 类全外显子组数据的分析。”40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。此次“千人基因组”项目共处理了1000份人类全外显子组数据,总数据量达2TB。整个分析全程无人值守、无 命令操作,仅仅点击了4次鼠标就启动了11000多项分析任务。

一跃千年

相比较人类基因缓慢的进化速度,有关基因组测序速度和能力的进化在这短短的20年内可谓“天翻地覆”。

1977年,当剑桥大学的F.Sanger等人发明了利用DNA聚合酶的双脱氧链终止原理测定核苷酸序列的方法之后,研究人员发表了第一个进行全基因组测序的噬菌体的基因组PhiX174(全长5375个碱基),那时在一年内可 对1000个碱基对进行测序。研究者预计:若按照当时的测序方法若是对人类进行全基因组测序,则需花费一百万年的时间。

2001年,6个国家的科学家花了11年的时间、30亿美元,共同发表首个人类基因组工作草图,两年后,全世界最早的人类全基因组参考序列公布。

到了2006年,全基因组测序的花费降至了2000万美元;2007年,二代测序技术诞生,并将全基因组测序的花费进一步降低至200万美元;2008年,在二代测序技术的推动下,全基因组测序成本降至20万美元;2010年降 至1万美元以下,彼时,进行全基因组测序的时间成本已经从11年下降到了数周时间。

从2005年第一代测序仪Roche454单次产生400MB的基因序列文件,到2010年第二代测序仪IlluminaHiseq2000单次产生200GB的基因序列文件,基因测序的速度在短短五年内就提升了500倍。

“其实在2008年之前,由于进行全基因组测序的花费高、耗时长,二代测序的市场我们常常称之为科研市场,也就意味着这项技术在那时是不具备普及性和临床使用价值的。”Illumina大中华区总经理赵瑞林表示

商业化破局

作为全球测序设备的“鼻祖”,测序设备生产商Illumina借着基因检测的浪潮在近几年异军突起,股票价格由2001年的15.94美元上涨至如今的140美元,最高峰时期涨幅达到了24倍,市值高达205亿美元。

而对于Illumina来说,近几年最值得他们骄傲的当数IlluminaHiseqX10测序系统,对于这套系统,业内有个很生动的比方:就好比汽车工业里的10万元家庭轿车,从此开启了测序市场的井喷时代,它将单次全基因组 测序的成本降至了1000美元以下。

“X10的诞生意味着全基因组测序市场真正进入了临床时代,事实上,Illumina现在也希望可以借此从一家纯粹的科研仪器公司转型变为一家临床公司。”赵瑞林表示。

从公共信息可知,HiseqX10是一套共10台超高通量测序仪,专为大规模人类全基因组测序而打造。一套设备至少10台起买,每台HiseqX10价格均超过为100万美元。在2014年,一套IlluminaHiseqX10可在3天时间内, 测出180个人的全基因组,前不久刚刚完成私有化的药明康德就曾在2014年购入过一套HiseqX10系统,希望借此布局自身的基因检测业务。

“在基因检测领域的下一个兵家必争之地就是癌症和产前筛查。事实上,早在2015年,中国就已经变成了仅次于美国的第二大测序市场,其中很多客户都来自于民营企业。”赵瑞林表示。

在前端测序市场,尽管目前三代测序还未在国内得到发展,但更多企业已经将目光放至了更为先进的四代测序市场。

相比于前面三代测序技术,第四代测序技术是真正实现单分子检测和电子传导检测相结合的测序方法,完全摆脱了洗脱过程、PCR扩增过程。作为最有希望实现1000美元基因组甚至100美元基因组的技术,纳米孔技术 具有超高读长、高通量、更少的测序时间和更为简单的数据分析,实现了从低读长到超高读长、从光学检测到电子传导检测的双重跨越。

在2014年6月,罗氏公司以3.5亿美元价格收购了涉及四代测序概念的美国纳米孔测序公司GeniaTechnologies;与此同时,罗氏公司联合风投再次共同投资美国纳米孔测序公司StratosGenomics1500万美元。罗氏公司 还与IBM公司共同研发固态纳米孔技术。而Illumina和Lifetech也在着力发展或投资纳米孔测序技术。

回归国内,去年华大基因曾在全球发布了一款基因组数据分析云计算平台服务产品——BGIOnline,并携手阿里云合作。据了解,该平台的主要功能定位为对海量的新一代测序数据进行分析、存储和共享。阿里云高级 专家孟方介绍,BGIOnline平台通过阿里云提供的混合云部署模式可以解决华大内部客户高速低延时的数据传输需求,并使得华大基因的数据存储、分析计算可以降低成本。

“我们的目标是使用具有自主知识产权的测序仪和云端分析平台,在24小时内完成一个人从全基因组测序、分析到解读的全过程。虽然面临着不小的挑战,但生命的价值值得我们为之努力。这样的努力势必会使中国

在未来数十年在生命科学、生物产业获得持续增长的强劲动力。”华大基因股份有限公司CEO尹烨表示。

相关文章
|
2月前
|
存储 城市大脑 运维
中国信通院&沙利文最新报告:阿里云混合云全面领先
中国信息通信研究院与国际权威分析机构沙利文(Frost & Sullivan)联合发布《2023 混合云价值影响力矩阵》,报告显示,阿里云是唯一一家全域领导者,在技术表现域、战略布局域以及市场表现域三个维度均排名领先于97%的企业。
104 1
|
3月前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
745 2
|
1天前
|
弹性计算 数据库 Docker
学习阿里云架构设计知识2-翀举
VPC分区清晰架构,VSW网络分隔,CEN连通VPC,按量付费小规格,均衡策略,ESS/ACK内置SNAT,ECS用NAT上网。建DMZ需VPC、VSW、NAT、EIP。主系统多VPC/VSW配ECS和Redis,CEN全连接。CEN设路由表,外网访问设DMZ、CEN、EIP,加堡垒机。Web系统ACR部署WordPress,配数据库。验证WordPress、弹性伸缩,测外访、发文、负载。含架构图。
13 1
学习阿里云架构设计知识2-翀举
|
10天前
|
人工智能 分布式计算 Cloud Native
阿里云PAI平台架构介绍
阿里云PAI平台架构介绍
23 0
|
24天前
|
人工智能 Serverless 数据处理
利用阿里云函数计算实现 Serverless 架构的应用
阿里云函数计算是事件驱动的Serverless服务,免服务器管理,自动扩展资源。它降低了基础设施成本,提高了开发效率,支持Web应用、数据处理、AI和定时任务等多种场景。通过实例展示了如何用Python实现图片压缩应用,通过OSS触发函数自动执行。阿里云函数计算在云计算时代助力企业实现快速迭代和高效运营。
|
1月前
|
存储 城市大脑 运维
中国信通院&沙利文最新报告,阿里云混合云全面领先
中国信通院&沙利文最新报告,阿里云混合云全面领先
17 1
中国信通院&沙利文最新报告,阿里云混合云全面领先
|
2月前
|
域名解析 弹性计算 网络协议
阿里云DNS常见问题之mx设置好但生效检测中未通过如何解决
阿里云DNS(Domain Name System)服务是一个高可用和可扩展的云端DNS服务,用于将域名转换为IP地址,从而让用户能够通过域名访问云端资源。以下是一些关于阿里云DNS服务的常见问题合集:
|
2月前
|
存储 城市大脑 运维
中国信通院&沙利文最新报告,阿里云混合云全面领先
日前,中国信息通信研究院与国际权威分析机构沙利文(Frost & Sullivan)联合发布《2023 混合云价值影响力矩阵》,报告显示,阿里云是唯一一家全域领导者,在技术表现域、战略布局域以及市场表现域三个维度均排名领先于97%的企业。
|
2月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
2月前
|
安全 数据处理 云计算
阿里云神龙架构的背景
阿里云神龙架构的背景

热门文章

最新文章