Sentieon性价比高75%,倚天ECS在基因测序场景的实践

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 基因组测序分析是生物信息学中常见的应用场景,具有重要意义。近期的新平台创新带来了大量数据,同时带来的是数据分析方面的挑战。基因组和外显子数据分析场景中,CPU在分析效率、资源可获得性以及弹性部署等多方便具备均衡的表现,相对于FPGA及GPU方案更具优势。在分析大量基因组数据时,倚天CPU展现了出色的性能和经济性。本文通过在阿里云E-HPC平台上使用Sentieon进行基因组测序分析实验,结果显示倚天实例相对于同规格的7代x86实例可实现高达75%的性价比优势,是客户降本增效的最佳选择。

基因组分析的背景

基因组测序分析是云超算中最常见的生物信息学应用场景,是大多数生命科学和医疗保健领域的重要组成部分,也是许多技术突破的关键。2022年对基因组学研究者来说是一个令人兴奋的年份,因为Illumina宣布将30X全基因组测序的成本降至每个基因组200美元,同时华大智造和其他平台也陆续推出了新的仪器。虽然这些平台为基因组数据生成提供了令人兴奋的新选择,但是由于平台特定的数据特性和大量生成的数据,它们也带来了数据分析方面的新挑战。

在分析大量基因组和外显子数据的高性能解决方案中,包括GPU和FPGA在内的异构硬件加速方案可以显著提高分析速度。然而,通用CPU的加速方案在分析效率、可及性和部署灵活度方面都表现得非常均衡,无论是快速周转需求(例如,在急诊科从单个患者基因组中预测不良药物反应)还是高吞吐量需求(例如,在肿瘤学实验室中分析来自不同患者的多个样本),都可以通过CPU得到满足。

基因组分析软件的选择

在基因组数据分析中,传统的流程GATK一直是评估变异位点准确性的标准。然而,由于它是用Java编写的,性能与速度并不出众。梅奥诊所和华大基因发表的多个文献表明,使用C++编写并针对现代向量CPU进行优化的Sentieon软件,在没有损失准确性的情况下速度明显优于GATK,越来越成为基因测序行业的主流选择。

类别

软件版本

基因检测软件

sentieon-genomics-202112.06

OS

Alinux3

多种计算实例在基因组分析场景的比较

生物信息学应用中,倚天CPU的性能表现如何?作为云计算芯片,其经济性如何?最佳性价比的运算资源应该如何配置?生信分析人员可能没有时间或经验在不同的计算平台上进行系统基准测试或计算分析成本。为了填补这些空白,本文将使用业界主流分析流程Sentieon DNAscope,通过在阿里云E-HPC平台上提供的最新ARM和x86实例上进行运行时间基准测试和云成本估算。

经过对多组WGS数据进行的基准测试和分析,发现各数据集都表现出了类似的运行时间和成本特征。为简化说明,本文将重点介绍使用Illumina NovaSeq系统测序的标准参考样本HG002的30x PCR-free建库测序数据集,并采用GRCh38作为参考基因组,包括GRCh38主要染色体和其他假染色体,但不包括ALT染色体或HLA基因。相比于上一代基因组GRCh37,GRCh38有显著改进,并已被人类遗传学界广泛采用。 在本次测试中,我们基于阿里云E-HPC平台同时向X86及ARM不同规格实例提交相同的WGS测序任务,以横向对比其性能及成本消耗。该基准测试流程以FASTQ文件作为输入,以VCF文件作为输出,其中包括比对、排序、去重、变异检测以及过滤等步骤。 通过测试,我们获得了如下的数据

CPU 实例 vCPU/Mem(GB) 运行时长 (mins)

实例按量价格

(元/小时)

计算成本

(一次计算多少元)

性价比
Intel c7.16xlarge 64/128 86.4 13.05 18.792 100%
c8i.16xlarge 64/128 59.7 13.7 13.6315 138%
AMD c7a.16xlarge 64/128 77.4 9.39 12.1131 155%
c8a.16xlarge 64/128 59.88 12.39 12.36522 152%
Ampere c6r.16xlarge 64/128 79.8 9.97 13.2601 142%
倚天 c8y.16xlarge 64/128 75.6 8.54 10.7604 175%

image.png

总结

从测试结果看,倚天实例与同规格的7代x86实例相比,性价比优势最高达到了75%,相对于8代x86实例最常用的c8i及c8a,性价比也分别有27%和15%的优势,是云超算基因组测序分析场景客户降本增效的最佳选择。

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
15天前
|
Kubernetes 监控 Serverless
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。
|
17天前
|
存储 编解码 大数据
阿里云服务器实例选择参考:根据业务场景选择云服务器实例规格
对于初次接触阿里云服务器的用户来说,面对众多实例规格往往不知道如何选择,因为云服务器实例规格不同,价格也不一样,往往会感到无从下手。本文旨在通过详细解析阿里云服务器的不同实例规格及其适用场景,为用户提供一份实用的选型指南,以供参考。
|
16天前
|
安全 网络安全 数据中心
服务器托管适用什么场景?
在数字化时代,服务器托管对企业运营至关重要。本文解析了五种常见托管方式:共享托管经济实惠,适合小型网站;VPS灵活可控,适合中小型企业;专用服务器性能卓越,适合大型应用;云托管灵活扩展,适应现代需求;托管式服务外包管理,省心省力。选择时需综合考虑预算、技术能力及性能要求,找到最佳解决方案。
20 0
|
2月前
|
存储 人工智能 网络协议
浅聊阿里云倚天云服务器:c8y、g8y、r8y实例性能详解与活动价格参考
选择一款高性能、高性价比的云服务器对于企业而言至关重要,阿里云推出的倚天云服务器——c8y、g8y、r8y三款实例,它们基于ARM架构,采用阿里自研的倚天710处理器,并基于新一代CIPU架构,通过芯片快速路径加速手段,实现了计算、存储、网络性能的大幅提升。2025年,计算型c8y云服务器活动价格860.65元一年起,通用型g8y云服务器活动价格1187.40元一年起,内存型r8y云服务器活动价格1454.32元一年起。本文将为大家详细解析这三款实例的性能特点、应用场景以及最新的活动价格情况,帮助大家更好地了解阿里云倚天云服务器。
|
2月前
|
人工智能 监控 测试技术
阿里云磐久服务器稳定性实践之路
阿里云服务器质量智能管理体系聚焦自研服务器硬件层面的极致优化,应对高并发交付、短稳定性周期、早问题发现和快修复四大挑战。通过“三个重构”(质量标准、开发流程、交付模式)、“六个归一”(架构、硬件、软件、测试、部件、制造)策略,实现芯片、整机和云同步发布,确保快速稳定上量。此外,全场景测试体系与智能预警、分析、修复系统协同工作,保障服务器在萌芽阶段发现问题并及时解决,提升整体质量水平。未来,阿里云将继续深化大数据驱动的质量管理,推动服务器行业硬件质量的持续进步。
|
2月前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
4月前
|
人工智能 安全 Linux
|
4月前
|
存储 弹性计算 NoSQL
"从入门到实践,全方位解析云服务器ECS的秘密——手把手教你轻松驾驭阿里云的强大计算力!"
【10月更文挑战第23天】云服务器ECS(Elastic Compute Service)是阿里云提供的基础云计算服务,允许用户在云端租用和管理虚拟服务器。ECS具有弹性伸缩、按需付费、简单易用等特点,适用于网站托管、数据库部署、大数据分析等多种场景。本文介绍ECS的基本概念、使用场景及快速上手指南。
153 3
|
5月前
|
弹性计算 前端开发 JavaScript
高校学生在家实践ECS弹性云服务器
简单谈谈我这几周使用ECS弹性云服务器的体验感
|
4天前
|
弹性计算 运维 监控
【阿里云】控制台使用指南:从创建ECS到系统诊断测评
本文介绍了如何通过阿里云获取ECS云服务器并进行操作系统配置与组件安装,以实现高效的资源管理和系统监控。阿里云凭借强大的基础设施和丰富的服务成为用户首选。文中详细描述了获取ECS、RAM授权、开通操作系统控制台及组件安装的步骤,并展示了如何利用控制台实时监控性能指标、诊断系统问题及优化性能。特别针对idle进程进行了深入分析,提出了优化建议。最后,建议定期进行系统健康检查,并希望阿里云能推出更友好的低成本套餐,满足学生等群体的需求。
62 17
【阿里云】控制台使用指南:从创建ECS到系统诊断测评

相关产品

  • 云服务器 ECS