X86 vs ARM 架构同台竞技: 生物大数据大规模并行计算(如何将WGS全基因组计算成本降到1美元)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: Sentieon DNAseq 实施的全基因组测序 (WGS) 二级分析流程与行业标准的 BWA-GATK 最佳实践流程结果相匹配,且运行速度提高了 5-20 倍。Sentieon软件安装简单,开箱即用,并且提供了与ARM和x86指令集适配的版本。使30X WGS 数据样本在OCI 实例上的计算成本压缩到每个样本 1 美元以下,处理时间缩短到近一小时。

背景介绍

基因组序列分析是生命科学和医疗保健行业领域的重要组成部分,是众多技术突破的关键。随着生命数字化时代的来临,为了解决大数据带来的速度与费用问题,在云计算平台进行流程的分析及计算是目前较流行的方案。然而大部分用户通常直接采用了未优化的软硬件配置,导致样本分析成本过高。因此,如何在云平台上选择合适的硬件配置,从而平衡计算成本与分析速度,成为了值得探索的问题。

为此,Oracle甲骨文云发布了相应的评测文章,该测试项目使用了OCI提供的最新的 ARM 和 x86计算实例,利用OCI硬件资源分配与优化机制,搭配Sentieon软件进行了一系列的运算耗时和云成本估算的基准测试。旨在为用户实现全基因组二级分析的高效计算和低成本的最佳平衡。

在分析流程上,该项目选择了Sentieon DNAseq(v202112.01)流程作为软件方案。Sentieon DNAseq 作为行业金标准 BWA-GATK 的直接替代品,不仅能提供与 BWA-GATK 流程一致的分析结果,而且灵活性强,运行速度更比GATK 快 5-20 倍。

我们将在本篇文章中详细展示测试细节和深度分析,供生物大数据分析研究人员参考。

测试细节

测试环境

该项目测试工作使用了OCI提供的最新的AMD、ARM 和 Intel处理器。下表为各个云计算实例的配置情况。相比于其他云计算服务平台,OCI的优势之一是允许用户灵活指定所需的CPU线程数,内存数,存储以及输入/输出,从而达到与应用流程的最佳适配和最优的使用成本。

image.png

测试设置

测试的分析流程使用了与行业金标准的BWA-GATK 结果匹配的Sentieon DNAseq流程。该项目对七组 WGS 数据进行了基准测试和成本估算分析,测试结果发现所有数据集的运行时间和计算成本特征都表现相似。因此,测试结果的分析将重点关注其中的两个数据集,分别为 Illumina HiSeq X 和Illumina NovaSeq 系统测出的 30X HG002 数据(无 PCR 样本)。

在参考基因的选择方面,相比于GRCh37版本,GRCh38版本参考基因组可显著提升序列的完整性和准确度,已作为业界标准被广泛采用。因此该项目采用了 GRCh38 作为参考基因(包括primary contigs以及额外的decoy contigs,不含ALT contigs或者HLA基因);Benchmark分析流程以FASTQ 文件作为输入并生成 VCF 输出文件,流程步骤包括比对、排序、重复数据的删除、BQSR 及变异检测。

测试结果

测试项目依据不同的线程数,内存,以及存储资源的申请,创建了共计11个测试实例,具体配置以及计算成本的评估结果如下表所示。

image.png说明:WGS 分析中涉及的其他操作,例如作业执行脚本的设置、输入数据的上传与输出数据的下载等,这些额外步骤所消耗的资源成本将分摊到各个测试实例上(表 2 中的评估数据不包含这部分的资源成本,也不包含生产云计算操作所需的其他资源成本,以及 Sentieon DNAseq 许可证成本)。另外这里额外增加了 0.0171 美元或 0.0457 美元,以对应 500-GB 或 1000-GB 存储系统的每小时资源成本。

测试结果显示,Sentieon DNAseq在OCI的大部分ARM实例上实现了30x WGS的整体分析成本低于1美元,最低在ARM-S实例上处理NovaSeq 30x WGS成本0.9美元。

image.png

资源监控

OCI极佳的资源可调性确保了用户在配置全基因组以及其他分析流程时,可以找到速度与成本的最佳平衡点。同时OCI平台的控制面板也提供了资源监测工具,帮助用户确认所调用的运算资源是否匹配流程所需。如下图所展示的,是在VM.Standard.A1.Flex实例上运行全基因组分析时运算资源的表现。

image.png我们知道在全基因组的二级分析流程中,比对和变异检测步骤主要依赖CPU的运算,而排序以及去重则是I/O需求较重的步骤。由测试结果可知,Sentieon DNAseq 流程工作时,在大部分时间段内的内存利用率均保持 90%左右,CPU 利用率近乎100% ,只有在排序和去重步骤时稍低;这一结果与我们的预期一致。而在 IO 密集的工作阶段,磁盘I/O峰值已达到了 240 MB/s 的硬件限制。由此说明,Sentieon DNAseq流程工作时可充分利用OCI平台提供的所有可用的硬件资源,实现最佳的运行效率。

CPU性能

Sentieon DNAseq 可以通过在多台服务器上利用更多的 vCPU并行运行,以进一步提高分析速度。此外,由结果可观察到尽管 ARM 处理器不支持超线程,但其仍可提供与 x86 相比具有竞争力的性能表现。

内存性能

为了准确地评估生产环境下测试机器的 I/O 能力,该测试项目中保留了 WGS 分析通常需要的所有关键输出文件,其中 NovaSeq 样本生成了大约 90 GB 的结果文件,而 HiSeq 生成了 120 GB 的结果文件。另外,测试发现,当磁盘容量(及相应的吞吐量性能)从 500 GB (240 MB/s) 增加到 1000 GB (480 MB/s) 时,程序 I/O 速度也有所提高。

可扩展性

将“通量”定义为每天能够处理的30x全基因组数据的个数,下图展示了不同实例的通量与所用线程的关系。其中 AMD-X shape 每天可以处理 32 个 30X 数据集,而 ARM-S shape 只能处理 10 个数据集。

同时,该图还展示了 Sentieon DNAseq 程序的可扩展性。由图可知,通量与所用线程成正比,表明 Sentieon DNAseq 扩展性优异,可最大程度地利用可用硬件资源。

image.png结论

  • OCI 提供的最新 ARM 实例能够很好的处理全基因组测序 (WGS) 二级分析类型的计算密集型和I/O 密集型的 HPC任务。此外,凭借 ARM 强大的计算速度和及更低的成本优势,OCI 的 ARM 实例可为用户提供性价比最佳的解决方案, 30X WGS 数据样本的FASTQ-to-VCF 分析,计算成本不到 1 美元。
  • OCI平台可精确调节各项运算资源,可有效减少资源浪费,降低了用户的计算成本。
  • Sentieon DNAseq 实施的全基因组测序 (WGS) 二级分析流程与行业标准的 BWA-GATK 最佳实践流程结果相匹配,且运行速度提高了 5-20 倍。
  • Sentieon软件安装简单,开箱即用,并且提供了与ARM和x86指令集适配的版本。使30X WGS 数据样本在OCI 实例上的计算成本压缩到每个样本 1 美元以下,处理时间缩短到近一小时。

参考信息

Sentieon软件中文网站:https://www.insvast.com/sentieon

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
17天前
|
Ubuntu Linux
查看Linux系统架构的命令,查看linux系统是哪种架构:AMD、ARM、x86、x86_64、pcc 或 查看Ubuntu的版本号
查看Linux系统架构的命令,查看linux系统是哪种架构:AMD、ARM、x86、x86_64、pcc 或 查看Ubuntu的版本号
130 3
|
5天前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
25天前
|
机器学习/深度学习 算法 数据库
阿里云服务器架构区别解析:从X86计算、Arm计算到高性能计算架构的区别参考
在我们选择阿里云服务器的架构时,选择合适的云服务器架构对于提升业务效率、保障业务稳定至关重要。阿里云提供了多样化的云服务器架构选择,包括X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器以及高性能计算等。本文将深入解析这些架构的特点、优势及适用场景,以供参考和选择。
阿里云服务器架构区别解析:从X86计算、Arm计算到高性能计算架构的区别参考
|
23天前
|
存储 监控 安全
大数据架构设计原则:构建高效、可扩展与安全的数据生态系统
【8月更文挑战第23天】大数据架构设计是一个复杂而系统的工程,需要综合考虑业务需求、技术选型、安全合规等多个方面。遵循上述设计原则,可以帮助企业构建出既高效又安全的大数据生态系统,为业务创新和决策支持提供强有力的支撑。随着技术的不断发展和业务需求的不断变化,持续优化和调整大数据架构也将成为一项持续的工作。
|
24天前
|
监控 持续交付 开发者
资源紧张下的创新之道:揭秘高效可扩展架构的设计秘诀,让技术与成本达到完美平衡!
【8月更文挑战第22天】在科技行业的快节奏发展中,设计出经济高效且可扩展的架构是每位工程师面临的挑战。本文提出五大策略:精准需求分析确保目标清晰;模块化设计如微服务架构促进独立开发与扩展;选择成熟技术栈及利用云服务提升系统效能;实施自动化流程如CI/CD加速开发周期;建立全面监控体系保障系统健康。遵循设计原则如SOLID,结合这些策略,即便资源有限也能构建出高质量、灵活应变的系统。
32 0
|
24天前
|
数据可视化 NoSQL Serverless
现代化 Web 应用构建问题之Serverless架构的Web站点费用计算如何解决
现代化 Web 应用构建问题之Serverless架构的Web站点费用计算如何解决
32 1
|
8天前
|
缓存
计算机X86架构
【9月更文挑战第7天】计算机的基本工作原理,重点阐述了CPU(中央处理器)及其内部结构,包括运算单元、数据单元和控制单元的功能。文中还解释了内存、总线(地址总线和数据总线)的作用,并简述了x86架构与操作系统交互的关键部分及基本指令集。
|
13天前
x86体系架构学习
x86体系架构学习
|
19天前
|
弹性计算 运维 Serverless
揭秘ADB Serverless架构:如何实现无服务器计算的神奇魔法?
【8月更文挑战第27天】随着云计算的演进,Serverless架构作为一种新兴计算模式崭露头角。阿里云函数计算(简称ADB)提供了一种无需管理服务器即可运行代码的服务。本文通过案例探讨ADB Serverless模式的实现方式。首先介绍Serverless架构的基础概念,即事件驱动模型,使开发者仅需关注业务逻辑,减轻了基础设施构建与维护的负担。ADB采用分布式、无状态的设计,确保高可用性和弹性伸缩能力。以一个简单的Web应用为例,展示了如何利用ADB快速实现根据用户输入返回问候语的功能,突显出其简化开发流程、提高性能与可扩展性的优势。
30 0
|
25天前
|
Java API 微服务
Java微服务架构应对互联网应用的大规模访问与快速迭代挑战
Java微服务架构应对互联网应用的大规模访问与快速迭代挑战,通过将应用分解为小型、自治的服务,增强系统灵活性与可扩展性。本文概览微服务定义及特点,深入剖析服务拆分、注册发现、API网关等核心原理,并介绍Spring Boot、Spring Cloud、Docker与Kubernetes等关键技术实践,助力高效构建稳定、高性能的企业级应用。
26 0