生信分析场景下，如何将 BLAST 作业计算成本降低 91%

2023-10-16 191

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

无影云电脑企业版，4核8GB 120小时 1个月

无影云电脑个人版，1个月黄金款+200核时

轻量应用服务器 4vCPU 16GiB，适用于搭建游戏自建服

简介： Memory Machine Cloud 能够有效的为应用自动更换云主机实例，无需始终按照最高需求来设置固定的云主机类型。

客户名称：宏序生物

所属行业：医疗

客户简介：致力于在临床医学、生命健康提供一站式、全方位服务和系统解决方案。

宏序生物面临的挑战

宏序生物生信团队使用的主要计算分析工具之一是 BLAST，可将输入的核酸或蛋白质序列与数据库中的已知序列进行比对，获得序列相似度等信息。为实现IT资源的弹性伸缩和优化管理，宏序生物的大多数 BLAST 都已经在云服务器上运行。BLAST 工作负载在运行过程中并不会保持一直占用固定的算力资源比例，所需的云资源需求随时波动变化，包括 "高峰"和“低谷”的用量需求。

应对这种业务上的起伏波动，最简单粗放的解决方案是以业务最高峰时的云资源用量来匹配对应的云主机实例，这种方式本质上是一种不顾成本的过度配置。

举个例子，在BLAST 运行过程中的云主机实例按照最高业务压力时刻的配置为 32 个 vCPU 和 64GB 云内存，此时任务可以在 11 小时 44 分钟内完成，成本高达 17.22 美元。而如果考虑成本节省改为较低配置（按照各个时刻的资源消耗的平均值），可以将云主机实例成本降低到 12.63 美元，便宜 27%。但是带来的代价则是性能下降，低配置云主机实例会导致运行时间增加了 53%，达到 18 小时 4 分钟。

另一方面，如果客户为了节省成本而选择 Spot 云主机实例，在 Spot 云主机实例中运行 BLAST 可以显著降低成本，但也同样存在问题，如果发生 Spot 实例被回收，将停止作业，需要从头开始运行，影响整体生产效率。

MemVerge提供的解决方案

Memory Machine Cloud 的 WaveRider 功能，能够在应用运行时，根据当前的云主机业务压力，有效的为应用自动更换云主机实例，因此可以有效解决 "高峰" 时对于云资源的弹性需求，无需始终按照最高需求来设置固定的云主机类型。

MemVerge 的 SpotSurfer 技术使得长时间运行的 BLAST 在 Spot 云主机实例上安全运行成为可能，因为它们可以在 Spot 云主机实例被回收时，将应用运行时刻的状态保护起来，并迁移到新的实例中继续运行。

下图显示了 WaveRider 如何使宏序生物的 BLAST 工作负载能够根据业务压力来自动调整云主机实例类型。

云主机实例之间的变更和业务迁移是完全自动化的，不需要用户干预。自动化的相关策略（如设置限制最大云主机规格，设置变更时的步长等等）用户可以通过 Memory Machine Cloud 的 CLI 工具或者基于 Web 的 GUI 图形来设置。因此，这使得宏序生物团队可以根据需要自行调整 WaveRider 迁移规则以持续优化成本和性能。

WaveRider 功能为用户的那些起伏波动的业务，在性能和成本之间提供了完美的平衡，与高规格的云主机类型选项（32vCPU，32GB RAM）相比，成本降低了 93%，但执行时间几乎相同，为 12 小时 23 分钟 vs 11 小时 44 分钟。对于每天在云中运行 1,000 个 BLAST 应用程序的企业来说，使用 Memory Machine Cloud的 WaveRider 功能可以节省每天 16,065 美元，年度节省 4,173,000 美元。

以上产品已上架云市场，Get宏旭生物同款体验，30天免费试用中。