Sentieon性价比高75%,倚天ECS在基因测序场景的实践

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDSClaw,2核4GB
简介: 基因组测序分析是生物信息学中常见的应用场景,具有重要意义。近期的新平台创新带来了大量数据,同时带来的是数据分析方面的挑战。基因组和外显子数据分析场景中,CPU在分析效率、资源可获得性以及弹性部署等多方便具备均衡的表现,相对于FPGA及GPU方案更具优势。在分析大量基因组数据时,倚天CPU展现了出色的性能和经济性。本文通过在阿里云E-HPC平台上使用Sentieon进行基因组测序分析实验,结果显示倚天实例相对于同规格的7代x86实例可实现高达75%的性价比优势,是客户降本增效的最佳选择。

基因组分析的背景

基因组测序分析是云超算中最常见的生物信息学应用场景,是大多数生命科学和医疗保健领域的重要组成部分,也是许多技术突破的关键。2022年对基因组学研究者来说是一个令人兴奋的年份,因为Illumina宣布将30X全基因组测序的成本降至每个基因组200美元,同时华大智造和其他平台也陆续推出了新的仪器。虽然这些平台为基因组数据生成提供了令人兴奋的新选择,但是由于平台特定的数据特性和大量生成的数据,它们也带来了数据分析方面的新挑战。

在分析大量基因组和外显子数据的高性能解决方案中,包括GPU和FPGA在内的异构硬件加速方案可以显著提高分析速度。然而,通用CPU的加速方案在分析效率、可及性和部署灵活度方面都表现得非常均衡,无论是快速周转需求(例如,在急诊科从单个患者基因组中预测不良药物反应)还是高吞吐量需求(例如,在肿瘤学实验室中分析来自不同患者的多个样本),都可以通过CPU得到满足。

基因组分析软件的选择

在基因组数据分析中,传统的流程GATK一直是评估变异位点准确性的标准。然而,由于它是用Java编写的,性能与速度并不出众。梅奥诊所和华大基因发表的多个文献表明,使用C++编写并针对现代向量CPU进行优化的Sentieon软件,在没有损失准确性的情况下速度明显优于GATK,越来越成为基因测序行业的主流选择。

类别

软件版本

基因检测软件

sentieon-genomics-202112.06

OS

Alinux3

多种计算实例在基因组分析场景的比较

生物信息学应用中,倚天CPU的性能表现如何?作为云计算芯片,其经济性如何?最佳性价比的运算资源应该如何配置?生信分析人员可能没有时间或经验在不同的计算平台上进行系统基准测试或计算分析成本。为了填补这些空白,本文将使用业界主流分析流程Sentieon DNAscope,通过在阿里云E-HPC平台上提供的最新ARM和x86实例上进行运行时间基准测试和云成本估算。

经过对多组WGS数据进行的基准测试和分析,发现各数据集都表现出了类似的运行时间和成本特征。为简化说明,本文将重点介绍使用Illumina NovaSeq系统测序的标准参考样本HG002的30x PCR-free建库测序数据集,并采用GRCh38作为参考基因组,包括GRCh38主要染色体和其他假染色体,但不包括ALT染色体或HLA基因。相比于上一代基因组GRCh37,GRCh38有显著改进,并已被人类遗传学界广泛采用。 在本次测试中,我们基于阿里云E-HPC平台同时向X86及ARM不同规格实例提交相同的WGS测序任务,以横向对比其性能及成本消耗。该基准测试流程以FASTQ文件作为输入,以VCF文件作为输出,其中包括比对、排序、去重、变异检测以及过滤等步骤。 通过测试,我们获得了如下的数据

CPU 实例 vCPU/Mem(GB) 运行时长 (mins)

实例按量价格

(元/小时)

计算成本

(一次计算多少元)

性价比
Intel c7.16xlarge 64/128 86.4 13.05 18.792 100%
c8i.16xlarge 64/128 59.7 13.7 13.6315 138%
AMD c7a.16xlarge 64/128 77.4 9.39 12.1131 155%
c8a.16xlarge 64/128 59.88 12.39 12.36522 152%
Ampere c6r.16xlarge 64/128 79.8 9.97 13.2601 142%
倚天 c8y.16xlarge 64/128 75.6 8.54 10.7604 175%

image.png

总结

从测试结果看,倚天实例与同规格的7代x86实例相比,性价比优势最高达到了75%,相对于8代x86实例最常用的c8i及c8a,性价比也分别有27%和15%的优势,是云超算基因组测序分析场景客户降本增效的最佳选择。

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6月前
|
弹性计算 运维 安全
阿里云轻量应用服务器与云服务器ECS啥区别?新手帮助教程
阿里云轻量应用服务器适合个人开发者搭建博客、测试环境等低流量场景,操作简单、成本低;ECS适用于企业级高负载业务,功能强大、灵活可扩展。二者在性能、网络、镜像及运维管理上差异显著,用户应根据实际需求选择。
534 10
|
6月前
|
运维 安全 Ubuntu
阿里云渠道商:服务器操作系统怎么选?
阿里云提供丰富操作系统镜像,涵盖Windows与主流Linux发行版。选型需综合技术兼容性、运维成本、安全稳定等因素。推荐Alibaba Cloud Linux、Ubuntu等用于Web与容器场景,Windows Server支撑.NET应用。建议优先选用LTS版本并进行测试验证,通过标准化镜像管理提升部署效率与一致性。
|
6月前
|
弹性计算 ice
阿里云4核8g服务器多少钱一年?1个月和1小时价格,省钱购买方法分享
阿里云4核8G服务器价格因实例类型而异,经济型e实例约159元/月,计算型c9i约371元/月,按小时计费最低0.45元。实际购买享折扣,1年最高可省至1578元,附主流ECS实例及CPU型号参考。
670 8
|
6月前
|
存储 监控 安全
阿里云渠道商:云服务器价格有什么变动?
阿里云带宽与存储费用呈基础资源降价、增值服务差异化趋势。企业应结合业务特点,通过阶梯计价、智能分层、弹性带宽等策略优化成本,借助云监控与预算预警机制,实现高效、可控的云资源管理。
|
6月前
|
弹性计算 运维 安全
区别及选择指南:阿里云轻量应用服务器与ECS云服务器有什么区别?
阿里云轻量应用服务器适合个人开发者、学生搭建博客、测试环境,易用且性价比高;ECS功能更强大,适合企业级应用如大数据、高流量网站。根据需求选择:轻量入门首选,ECS专业之选。
450 2
|
6月前
|
弹性计算 运维 安全
阿里云轻量应用服务器38元1年和云服务器99元1年怎么选?二者性能区别及选择参考
在阿里云当下的活动中,38元/年的轻量应用服务器与99元/年的云服务器ECS成为众多新用户的关注焦点。但是有部分用户并不是很清楚二者之间的区别,因此就不知道应该如何选择。接下来,笔者将为您详细剖析ECS云服务器与轻量应用服务器的差异,以供您参考和选择。
654 4
阿里云轻量应用服务器38元1年和云服务器99元1年怎么选?二者性能区别及选择参考
|
6月前
|
存储 弹性计算 监控
阿里云渠道商:如何挑选阿里云服务器配置?
本文详解通用型、计算型、内存型等实例适用场景,结合性能评估与成本优化策略,助力用户按需选择。以日均1万访问企业网站为例,2核4G+3M带宽月费约200元,性价比高。合理配置更省钱。
|
6月前
|
弹性计算
阿里云8核16G云服务器收费标准:最新价格及省钱购买方法整理
阿里云8核16G云服务器价格因实例类型而异。计算型c9i约743元/月,一年6450元(7折);通用算力型u1约673元/月,一年仅需4225元(5.1折)。实际价格享时长折扣,详情见ECS官网。