阿里云超算异构Spot集群,助力深势科技30%成本驱动MDaaS海量算力

本文涉及的产品
云服务器ECS,u1 2核4GB 1个月
云服务器 ECS,u1 4核8GB 1个月
云服务器 ECS,u1 4核16GB 1个月
简介: 本文主要介绍药物研发算法科技公司深势科技是如何实现低成本在阿里云上构建分子模拟MDaaS (Molecular Dynamics as a Service)超算集群。

本文主要介绍药物研发算法科技公司深势科技是如何实现低成本在阿里云上构建分子模拟MDaaS (Molecular Dynamics as a Service)超算集群。

image.png

客户简介

公司名称:深势科技

公司网址:http://dptech.deepmd.net/

公司介绍:

深势科技是一家成立于2018年的药物研发算法科技公司,致力于运用新一代分子模拟MDaaS (Molecular Dynamics as a Service)技术解决药物研发难题,实现药物分子的理性发现和设计。

企业的主要产品Hermite 药物研发套件,旨在帮助用户在第一性原理精度力场基础上,实现高通量药物筛选与优化;DP-Cloudserver软件,旨在帮助用户更便捷创建基于深度学习的原子间势能和力场模型和运行分子动力学模型,有效解决分子模拟中的准确性和效率性难以兼顾的问题。

公司由中科院院士领衔,核心团队来自北京大学、普林斯顿大学、上海药物研究所等高校和科研机构,在机器学习、第一性原理建模、RiD高效采样、生成算法、力场开发等方面有着深厚的技术积累,在小分子药物设计和大分子药物设计领域有着丰富的项目经验。

公司已在力场开发、小分子药物筛选与优化、药物ADMET性质预测、结合自由能微扰、多肽药物设计等领域提出更加高效和准确的解决方案,并与诸多来自学界和工业界的客户开展合作。目前已经获得来自知名投资机构的近2000万元天使投资。

业务痛点

深势科技的业务量波动较大,希望可以提供基于作业负载的弹性伸缩能力,最大化利用计算资源;

深势科技可以有效调度集群的计算资源,希望提供跨可用区的多规格实例弹性扩容,并且支持不同实例规格使用不同的镜像;

集群的作业量很大,所以深势科技希望可以提供作业粒度的费用账单便于计费;

深势科技作为一家初创企业,追求高性价比,以较低成本完成有效计算。

为什么选择阿里云?

主要是领先的产品与灵活的售卖模式。

阿里云是国内少有提供云上弹性高性能计算平台(EHPC)的云厂商,阿里云EHPC集群的自动伸缩功能,超越传统超算的“静态”资源分配,用户可根据负载实现按需扩容缩容。通过用户自定义设置,有效提升作业的吞吐量,加快作业处理速度,极大提升集群的利用率。

植根于阿里云自动运维与可视化管控技术,E-HPC提供集群管理、作业管理、用户管理和可视化等功能,帮助用户轻松使用云上HPC集群。阿里云后台实现对集群的主动运维、热升级与迁移,让HPC客户专注于应用与科研本身,无需费时费力于集群管理与运维,更加便捷地使用超算带来的便利。

同时基于费用中心的账单,EHPC提供开源计费工具,支持作业粒度的费用统计,高效解决计费需求。同时阿里云的抢占式实例提供了低成本的算力资源,价格最低达到按量付费的一折。

解决方案

image.png

方案细节:

深势科技通过阿里云弹性高性能计算的平台,调度下层多种算力资源。在选择算力资源时,深势科技多选用了具有低成本优势的抢占式实例,同时通过阿里云弹性供应解决方案,深势科技可以一次性获取所需的算力资源,无需关注底层实例。

由于客户需求多跟着项目周期走,深势科技的业务有不稳定的周期性,阿里云弹性高性能计算平台(EHPC)的自动伸缩功能,利用云上的弹性,根据作业负载自动管理计算资源,深势科技不需要自行管理资源规模,有助于深势科技降低运维成本。

深势科技需要计算每个用户、作业所用资源费用,帮助统计成本;阿里云EHPC的作业详情导出功能,可以查看每个作业的资源使用量。同时开发费用统计工具,结合费用中心账单可以统计每个作业的计算费用。

阿里云弹性供应组是一个使用抢占式实例和按量付费实例快速部署实例集群的方案,支持一键部署跨计费方式、跨可用区、跨实例规格族的实例集群,可以稳定提供计算力,在享受缓解抢占式实例的回收机制带来的不稳定因素,免去重复手动创建实例的繁琐操作。

因此,使用弹性供应的成本最优策略来调度抢占式实例资源,指定多个可用区和实例规格,确保以最优价格完成spot+按量计算资源的交付。按秒计费,价格最低至1折。

客户效益

1、满足了客户低成本构建高可用算力集群的需求:30%成本实现海量算力交付:深势科技利用弹性供应的成本优化策略,结合spot实例的价格巡检,以30%的成本完成日均3w+ vCPU资源的交付。

2、EHPC自动运维的易用特性,降低了深势科技的运维成本,提升了集群管理效率。

客户证言

分子模拟为我们提供了认识世界的重要工具,而具体实现这一过程一方面需要优质的算法,另一方面需要海量的计算资源。深势科技采用的“AI+物理建模+HPC”的研发范式,在算法层面取得了重大突破;而在资源层面,我们要感谢阿里云的弹性高性能计算服务在较低成本的基础上提供了海量的计算资源。接下来,深势科技会与阿里云进一步紧密合作,将“AI+物理建模+HPC+云计算”的MDaaS模式推及更多有需求的朋友们。——深势科技CEO孙伟杰

选用产品

弹性高性能计算E-HPC

弹性高性能计算(E-HPC)基于阿里云基础设施,为用户提供一站式公共云HPC/AI平台服务,面向科研,生产,教育和行业大计算,提供快捷,弹性,安全和与阿里云产品互通的云超算平台。

更多关于弹性高性能计算E-HPC的介绍,请参见弹性高性能计算E-HPC产品详情页。

云服务器ECS

云服务器(Elastic Compute Service,简称ECS)是阿里云提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别云计算服务。云服务器ECS免去了您采购IT硬件的前期准备,让您像使用水、电、天然气等公共资源一样便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。阿里云ECS持续提供创新型服务器,解决多种业务需求,助力您的业务发展。

更多关于云服务器ECS的介绍,参见云服务器ECS产品详情页。

抢占式实例

抢占式实例是云服务器ECS一种特殊的实例,相对于按量付费实例价格有一定的折扣,其价格以小时为周期根据供需情况不同而变化,最低可至按量付费的一折,旨在为用户降低部分场景下使用ECS实例的成本。

更多关于抢占式实例的介绍,参见抢占式实例文档页。

GPU 云服务器

提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚洲第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。

更多关于GPU云服务器的介绍,参见[GPU云服务器产品页面。
](https://www.aliyun.com/product/ecs/gpu?spm=a2c4g.11186623.2.23.147d4c07z464Zz)

弹性供应

弹性供应是一个使用抢占式实例和按量付费实例快速部署实例集群的方案,支持一键部署跨计费方式、跨可用区、跨实例规格族的实例集群。您可以通过弹性供应组稳定提供计算力,缓解抢占式实例的回收机制带来的不稳定因素,免去重复手动创建实例的繁琐操作。

更多关于弹性供应的介绍,参见弹性供应文档页。

原文链接:https://help.aliyun.com/document_detail/189683.html

相关实践学习
一小时快速掌握 SQL 语法
本实验带您学习SQL的基础语法,快速入门SQL。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
SQL 分布式计算 关系型数据库
阿里云E-MapReduce Trino专属集群外连引擎及权限控制踩坑实践
本文以云厂商售后技术支持的角度,从客户的需求出发,对于阿里云EMR-Trino集群的选型,外连多引擎的场景、Ldap以及Kerberos鉴权等问题进行了简要的实践和记录,模拟客户已有的业务场景,满足客户需求的同时对过程中的问题点进行解决、记录和分析,包括但不限于Mysql、ODPS、Hive connector的配置,Hive、Delta及Hudi等不同表格式读取的兼容,aws s3、阿里云 oss协议访问异常的解决等。
|
28天前
|
存储 弹性计算 监控
【阿里云云原生专栏】成本优化策略:在阿里云云原生平台上实现资源高效利用
【5月更文挑战第29天】本文探讨了在阿里云云原生平台上实现资源高效利用和成本优化的策略。通过资源监控与评估,利用CloudMonitor和Prometheus等工具分析CPU、内存等使用情况,识别浪费。实施弹性伸缩策略,利用自动伸缩规则根据业务负载动态调整资源。借助容器化管理和Kubernetes编排提高资源利用率,优化存储选择如OSS、NAS,以及网络配置如VPC和CDN。示例展示了如何使用Kubernetes的HorizontalPodAutoscaler进行弹性伸缩,降低成本。
128 4
|
9天前
|
负载均衡 测试技术 网络安全
阿里云服务网格ASM多集群实践(一)多集群管理概述
服务网格多集群管理网络打通和部署模式的多种最佳实践
|
1月前
|
SQL 分布式计算 数据挖掘
阿里云MaxCompute携手华大基因打造精准医疗应用云平台,十万基因组计算成本降低至1000美金以内
华大基因是中国最领先的基因科技公司,华大基因为消除人类病痛、经济危机、国家灾难、濒危动物保护、缩小贫富差距等方面提供分子遗传层面的技术支持。让我们结合maxcompute的技术特点,看看如何助力华大基因。
1968 12
|
29天前
|
存储 人工智能 运维
首批 I 阿里云通过算力服务成熟度增强级评估
近日,阿里云作为算力服务标准主要参编单位之一,参与了首批标准符合性验证,以阿里云飞天企业版为主要参评产品,完成了通用计算、智能计算和高性能计算三类计算服务能力的符合性评估。
|
1月前
|
存储 弹性计算 监控
【阿里云弹性计算】成本优化实战:利用阿里云 ECS 抢占式实例节省云支出
【5月更文挑战第21天】阿里云ECS的抢占式实例提供了一种成本优化策略,适合对中断容忍度较高的业务。通过创建和管理抢占式实例,结合API查询价格信息,企业能节省大量成本。使用时注意业务容错性,设置监控系统应对中断,结合其他成本优化措施,如存储类型选择和网络配置优化。确保业务可恢复性,关注阿里云政策,并根据业务变化调整策略,以实现成本与效益的最佳平衡。
72 3
|
1月前
|
存储 弹性计算 监控
利用阿里云云产品进行项目成本节约的实践
本文分享了利用阿里云降低成本的实践经验,主要通过选择合适的计费模式(如按量付费、包年包月和抢占式实例)、优化资源配置(弹性伸缩、资源监控与调整、适配存储方案)、利用优惠和成本管理工具(预留实例券、成本预警、优惠活动)以及案例分析,实现云计算成本的有效控制。通过这些策略,企业在保证灵活性和扩展性的同时,能更好地管理云服务成本,提高项目经济效益。
149 1
|
1月前
|
存储 弹性计算 监控
探索阿里云弹性计算:如何优化云服务器ECS的性能与成本
在云时代,【阿里云ECS】的性能优化与成本控制至关重要。利用实例规格选择、自动伸缩、网络和存储配置,可增强性能、减少成本。结合监控工具和优化建议,用户能解决性能问题,提升应用稳定性,实现高效且经济的云计算运营。
74 1
|
1月前
|
弹性计算 数据库 云计算
【阿里云弹性计算】云成本管理艺术:利用阿里云ECS预留实例节约成本
【5月更文挑战第26天】阿里云ECS预留实例助力企业有效管理云成本,提供预付费计费模式,降低高达70%的费用。适合长期稳定需求、可预测业务高峰和批量部署场景。通过预留实例,企业能确保资源保障、灵活调整并节约成本,实现成本优化与业务连续性的平衡。
113 0
|
1月前
|
云安全 人工智能 安全

热门文章

最新文章