高性能计算在云上进行服务,需要解决以下线下超算的哪些痛点?
• 弹性扩展难:实际业务中,往往难以预测突发情况的需求,因此,弹性伸缩十分 必要;
• 可靠性不高:计算中心或物理集群规模扩大之后,无法保证百分百的稳定性, 因此必然会出现重新计算的需求,针对此需求,云计算稳定的 SLA 之外,还实 现了断点续算技术;
• 性能瓶颈:云上计算突破了海量数据进行机器学习或筛查的 GPU 瓶颈,过去花 费数周数月才能够完成的计算,如今可缩短为几天;
• 成本挑战:过去,成本和算力难以兼得,自建超算中心往往 CAPEX 不低,且后 续运维成本 OPEX 更大,难以实现。
以上内容摘自《2022阿里云生命科学与智能计算峰会演讲合集》电子书,点击https://developer.aliyun.com/ebook/download/7724 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。