基于阿里云混合云架构的华大基因的BGIOnline,让基因检测从千年到21小时

简介: 华大基因、阿里云和安徽医科大学在深圳、杭州、合肥共同宣布,基于华大基因开发的新一代基因元计算平台BGIOnline,在21小时47分12秒内完成了1000例人类全外显子组数据的分析。”40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。
【云栖社区】在接到华大基因的感谢信之后,4月22日,阿里云总裁胡晓明发出全员信:我们在践行阿里云的使命——计算,为了无法计算的价值。

下述报道来自新浪微博:《基因检测“进化史”:从千年到一天》。


21小时47分12秒,这组数据被定格为了千人全基因测序的“中国速度”。

4月20日,来自“华大基因”的公号发出了一则消息:“华大基因、阿里云和安徽医科大学在深圳、杭州、合肥共同宣布,基于华大基因开发的新一代基因元计算平台BGIOnline,在21小时47分12秒内完成了1000例人 类全外显子组数据的分析。”40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。此次“千人基因组”项目共处理了1000份人类全外显子组数据,总数据量达2TB。整个分析全程无人值守、无 命令操作,仅仅点击了4次鼠标就启动了11000多项分析任务。

一跃千年

相比较人类基因缓慢的进化速度,有关基因组测序速度和能力的进化在这短短的20年内可谓“天翻地覆”。

1977年,当剑桥大学的F.Sanger等人发明了利用DNA聚合酶的双脱氧链终止原理测定核苷酸序列的方法之后,研究人员发表了第一个进行全基因组测序的噬菌体的基因组PhiX174(全长5375个碱基),那时在一年内可 对1000个碱基对进行测序。研究者预计:若按照当时的测序方法若是对人类进行全基因组测序,则需花费一百万年的时间。

2001年,6个国家的科学家花了11年的时间、30亿美元,共同发表首个人类基因组工作草图,两年后,全世界最早的人类全基因组参考序列公布。

到了2006年,全基因组测序的花费降至了2000万美元;2007年,二代测序技术诞生,并将全基因组测序的花费进一步降低至200万美元;2008年,在二代测序技术的推动下,全基因组测序成本降至20万美元;2010年降 至1万美元以下,彼时,进行全基因组测序的时间成本已经从11年下降到了数周时间。

从2005年第一代测序仪Roche454单次产生400MB的基因序列文件,到2010年第二代测序仪IlluminaHiseq2000单次产生200GB的基因序列文件,基因测序的速度在短短五年内就提升了500倍。

“其实在2008年之前,由于进行全基因组测序的花费高、耗时长,二代测序的市场我们常常称之为科研市场,也就意味着这项技术在那时是不具备普及性和临床使用价值的。”Illumina大中华区总经理赵瑞林表示

商业化破局

作为全球测序设备的“鼻祖”,测序设备生产商Illumina借着基因检测的浪潮在近几年异军突起,股票价格由2001年的15.94美元上涨至如今的140美元,最高峰时期涨幅达到了24倍,市值高达205亿美元。

而对于Illumina来说,近几年最值得他们骄傲的当数IlluminaHiseqX10测序系统,对于这套系统,业内有个很生动的比方:就好比汽车工业里的10万元家庭轿车,从此开启了测序市场的井喷时代,它将单次全基因组 测序的成本降至了1000美元以下。

“X10的诞生意味着全基因组测序市场真正进入了临床时代,事实上,Illumina现在也希望可以借此从一家纯粹的科研仪器公司转型变为一家临床公司。”赵瑞林表示。

从公共信息可知,HiseqX10是一套共10台超高通量测序仪,专为大规模人类全基因组测序而打造。一套设备至少10台起买,每台HiseqX10价格均超过为100万美元。在2014年,一套IlluminaHiseqX10可在3天时间内, 测出180个人的全基因组,前不久刚刚完成私有化的药明康德就曾在2014年购入过一套HiseqX10系统,希望借此布局自身的基因检测业务。

“在基因检测领域的下一个兵家必争之地就是癌症和产前筛查。事实上,早在2015年,中国就已经变成了仅次于美国的第二大测序市场,其中很多客户都来自于民营企业。”赵瑞林表示。

在前端测序市场,尽管目前三代测序还未在国内得到发展,但更多企业已经将目光放至了更为先进的四代测序市场。

相比于前面三代测序技术,第四代测序技术是真正实现单分子检测和电子传导检测相结合的测序方法,完全摆脱了洗脱过程、PCR扩增过程。作为最有希望实现1000美元基因组甚至100美元基因组的技术,纳米孔技术 具有超高读长、高通量、更少的测序时间和更为简单的数据分析,实现了从低读长到超高读长、从光学检测到电子传导检测的双重跨越。

在2014年6月,罗氏公司以3.5亿美元价格收购了涉及四代测序概念的美国纳米孔测序公司GeniaTechnologies;与此同时,罗氏公司联合风投再次共同投资美国纳米孔测序公司StratosGenomics1500万美元。罗氏公司 还与IBM公司共同研发固态纳米孔技术。而Illumina和Lifetech也在着力发展或投资纳米孔测序技术。

回归国内,去年华大基因曾在全球发布了一款基因组数据分析云计算平台服务产品——BGIOnline,并携手阿里云合作。据了解,该平台的主要功能定位为对海量的新一代测序数据进行分析、存储和共享。阿里云高级 专家孟方介绍,BGIOnline平台通过阿里云提供的混合云部署模式可以解决华大内部客户高速低延时的数据传输需求,并使得华大基因的数据存储、分析计算可以降低成本。

“我们的目标是使用具有自主知识产权的测序仪和云端分析平台,在24小时内完成一个人从全基因组测序、分析到解读的全过程。虽然面临着不小的挑战,但生命的价值值得我们为之努力。这样的努力势必会使中国

在未来数十年在生命科学、生物产业获得持续增长的强劲动力。”华大基因股份有限公司CEO尹烨表示。

相关文章
|
5天前
|
存储 运维 5G
基于阿里云数据库 SelectDB 内核 Apache Doris 的实时/离线一体化架构,赋能中国联通 5G 全连接工厂解决方案
数据是 5G 全连接工厂的核心要素,为支持全方位的数据收集、存储、分析等工作的高效进行,联通 5G 全连接工厂从典型的 Lambda 架构演进为 All in [Apache Doris](https://c.d4t.cn/vwDf8R) 的实时/离线一体化架构,并凭借 Doris 联邦查询能力打造统一查询网关,数据处理及查询链路大幅简化,为联通 5G 全连接工厂带来数据时效性、查询响应、存储成本、开发效率全方位的提升。
基于阿里云数据库 SelectDB 内核 Apache Doris 的实时/离线一体化架构,赋能中国联通 5G 全连接工厂解决方案
|
7天前
|
弹性计算 运维 监控
【阿里云弹性计算】从物理机到阿里云ECS:企业IT架构转型升级之路
【5月更文挑战第29天】随着云计算兴起,企业正转向阿里云ECS以应对传统物理机的挑战。本文详述了这一转型过程,包括现状评估、迁移计划制定、测试环境搭建、应用数据迁移及后期监控优化。转型升级可提升资源利用率,降低运维成本,加快业务响应,并增强数据安全。示例代码展示了使用阿里云Python SDK创建ECS实例的过程。
38 1
|
13天前
|
消息中间件 监控 Cloud Native
【阿里云云原生专栏】事件驱动架构在阿里云云原生生态中的角色与实施路径
【5月更文挑战第23天】本文探讨了事件驱动架构在阿里云云原生生态中的关键作用,强调其在微服务协同和应用创新中的效率提升。阿里云提供了EventBridge和EventMesh等服务支持EDA,其中EventBridge作为事件中枢,实现跨平台事件传递,而EventMesh提供高性能事件处理。通过事件模型设计、服务集成、开发处理器和监控优化四个步骤,用户可在阿里云上实施事件驱动架构,构建敏捷响应的云原生应用。随着云原生技术发展,EDA将成为企业数字化转型的重要推动力。
53 0
|
15天前
|
运维 监控 JavaScript
【阿里云云原生专栏】Serverless架构下的应用部署与运维:阿里云Function Compute深度探索
【5月更文挑战第21天】阿里云Function Compute是事件驱动的无服务器计算服务,让用户无需关注基础设施,专注业务逻辑。本文详述了在FC上部署应用的步骤,包括创建函数、编写代码和部署,并介绍了运维功能:监控告警、日志管理、版本管理和授权管理,提供高效低成本的计算服务。
228 6
|
16天前
|
架构师 数据挖掘 Python
最全pandas库(Python),2024年最新阿里云架构师面试
最全pandas库(Python),2024年最新阿里云架构师面试
最全pandas库(Python),2024年最新阿里云架构师面试
|
16天前
|
存储 弹性计算 Cloud Native
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
AutoMQ:如何基于阿里云计算与存储产品实现云原生架构升级
|
16天前
|
监控 负载均衡 Java
【阿里云云原生专栏】微服务架构在阿里云云原生平台上的应用实例与优化策略
【5月更文挑战第20天】本文介绍了在阿里云云原生平台实现微服务架构的步骤,包括基于Spring Cloud的Docker化部署、使用ACK部署微服务,以及优化策略:服务发现与负载均衡(借助Istio)和监控日志管理。通过这种方式,企业能提升应用的可扩展性、可维护性和敏捷性。
206 5
|
4天前
|
运维 负载均衡 Cloud Native
云原生架构技术之云原生微服务
微服务模式将后端单体应用拆分为松耦合的多个子应用,每个子应用负责一组子功能。这些子应用称为“微服务”,多个“微服务”共同形成了一个物理独立但逻辑完整的分布式微服务体系。这些微服务相对独立,通过解耦研发、测试与部署流程,提高整体迭代效率。此外,微服务模式通过分布式架构将应用水平扩展和冗余部署,从根本上解决了单体应用在拓展性和稳定性上存在的先天架构缺陷。但也要注意到微服务模型也面临着分布式系统的典型挑战:如何高效调用远程方法、如何实现可靠的系统容量预估、如何建立负载均衡体系、如何面向松耦合系统进行集成测试、如何面向大规模复杂关联应用的部署与运维。
22 4
|
5天前
|
敏捷开发 负载均衡 监控
探索微服务架构下的API网关设计与实践
【5月更文挑战第31天】本文将深入剖析微服务架构中的关键组件——API网关,探讨其设计理念、核心功能以及在实际项目中的应用。我们将从API网关的基本概念出发,逐步展开对其路由、负载均衡、认证授权、监控日志等方面的详细讨论,并结合实际案例,分析如何高效地实现和管理一个稳定的API网关。
|
5天前
|
缓存 监控 安全
微服务架构下的API网关设计与实践
【5月更文挑战第31天】本文深入探讨了在微服务架构中,API网关的核心作用与设计策略。通过分析网关的职责、选型标准及实现细节,文章为读者提供了一套完整的API网关解决方案。同时,结合具体案例,展示了如何在实际应用中有效部署和优化API网关,确保系统的高可用性和可扩展性。