带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案(下)

本文涉及的产品
云服务器 ECS,每月免费额度280元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案(下)

《生命科学行业云上解决方案及最佳实践》——阿里云高性能计算生命科学行业解决方案——阿里云 E-HPC 生命科学行业整体解决方案(上) :

https://developer.aliyun.com/article/1227252?groupCode=ecs




2 阿里云弹性高性能计算 E-HPC 介绍


1 E-HPC 产品介绍

基于阿里云自研的神龙架构,阿里云弹性高性能计算 E-HPC(Elastic High Performance

Computing)具备零损耗高性能算力、高性能网络和高性能存储等能力,在云上面向多个垂直行业提供极致性能的 HPC 服务,为客户的应用定制完备的全天候高性能计算环境。

image.png



阿里云弹性高性能计算 E-HPC 是国内首个云原生全栈高性能计算 PaaS 平台,为用户提供一站式公共云 HPC 服务,具备快捷、弹性、安全的特性,支持与阿里云产品互通。具体来说,E-HPC提供了 HPC 任务级弹性伸缩、高通量任务处理、作业管理与调度、云上云下混合调度、应用软件管理、资源生命周期管理等多种能力,支持 HPC+AI 应用,面向生命科学行业提供云上 HPC服务。


image.png



自动伸缩,敏捷扩容:超越传统高性能计算的“静态”资源分配,阿里云 E-HPC 自动伸缩、并行调度云上集群的“动态”算力,用户应用可根据负载实现按需扩容缩容,节约成本,消灭任务排队和算力不匹配,CPU 利用率达 90% 以上。


稳定轻松,专注专业:依托阿里云自动运维与可视化管控技术,阿里云 E-HPC 提供一系列的可视化集群管理,作业流和科学可视化功能,帮助用户轻松使用云上 HPC 集群。阿里云后台实现对集群的主动运维,热升级与迁移,让客户专注于应用与科研本身,无需关注 HPC 集群的管理与运维工作。


云上性能分析,自动优化:阿里云 E-HPC 可以将并行调优层级分析方法自动化输出为云上“性能大数据收集剖析优化引擎”,提供云上 HPC 业务性能分析与性能调优平台。自动从集群、节点、进程、函数的方式逐层分析关键指标,帮助客户应用以最高效的方式在云计算平台上运行。



2 阿里云超级计算集群 SCC

超级计算集群 SCC(Super Computing Cluster)在弹性裸金属服务器基础上,搭配高性能RDMA(Remote Direct Memory Access)互联网络,大幅提升网络性能,提高大规模集群加速比。SCC 在提供高带宽、低延迟优质网络通信的同时,还具备弹性裸金属服务器性能无损、特性无损的所有优点。


超级计算集群 SCC 主要用于工业仿真、人工智能、机器学习、科学计算、数据分析、音视频处理等高性能计算场景。在集群内,各节点通过 RDMA 网络互联,提供高带宽、低延迟网络,保证了 HPC 应用的高度并行需求。


3 阿里云高性能并行文件存储系统 CPFS

文件存储 CPFS (Cloud Parallel File Storage) 是阿里云完全托管、可扩展的并行文件存储系统,针对高性能计算场景的性能要求进行了深度优化,支持对数据毫秒级的访问和百万级 IOPS 的数据读写请求,可用于生物制药、基因测序等 HPC+AI 的生命科学行业场景。


多协议互访:同一份数据支持 POSIX、MPI-IO 与 NFS 协议互访

高吞吐:IO 带宽随容量线性提升,最大支持 20 GB/s

高 IOPS:IOPS 能力随容量扩展线性提升,最大支持 280 万 IOPS

低延时:稳定的亚毫秒级 IO 时延

海量文件:全对称的元数据服务器架构,百万级元数据 IOPS 能力

数据流动:支持基于配置策略与 OSS 中的数据进行流动,有效降低冷数据存储成本

2

3

相关文章
|
1月前
|
Linux 开发工具 C语言
Centos8下编译安装最新版ffmpeg解决方案(含Centos8换源阿里云)
Centos8下编译安装最新版ffmpeg解决方案(含Centos8换源阿里云)
144 3
|
1月前
|
弹性计算 运维 安全
2024年阿里云一键搭建部署幻兽帕鲁服务器解决方案
幻兽帕鲁火了,为了确保畅快体验游戏,构建高效、稳定的游戏服务器至关重要。幸运的是,阿里云为您提供了快速、简便的服务器搭建解决方案,即使您对技术知识了解有限,也能在短短一分钟内轻松完成《幻兽帕鲁》游戏的联机服务器搭建!
1450 4
|
18天前
|
消息中间件 NoSQL Kafka
云原生最佳实践系列 5:基于函数计算 FC 实现阿里云 Kafka 消息内容控制 MongoDB DML 操作
该方案描述了一个大数据ETL流程,其中阿里云Kafka消息根据内容触发函数计算(FC)函数,执行针对MongoDB的增、删、改操作。
|
1月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
1月前
|
自然语言处理 算法 关系型数据库
阿里云PAI大模型RAG对话系统最佳实践
本文为大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|
3月前
|
存储 机器学习/深度学习 人工智能
基于Megatron-Core的稀疏大模型训练工具:阿里云MoE大模型最佳实践
随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期以Mixtral为代表的MoE(多专家混合)大模型证明了稀疏MoE技术能大幅降低计算量、提升推理速度,模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队深入合作,基于Megatron-Core MoE框架,解决了MoE大模型训练落地时会遇到的可拓展性、易用性、功能性以及收敛精度等核心问题,在下游任务上取得了很好的模型效果。
|
3月前
|
存储 编解码 弹性计算
阿里云网盘与相册开发版提供了丰富的功能和全面的加速解决方案
阿里云网盘与相册开发版提供了丰富的功能和全面的加速解决方案【1月更文挑战第13天】【1月更文挑战第63篇】
27 2
|
3月前
|
人工智能 搜索推荐 数据挖掘
瓴羊X阿里云上的Salesforce联合解决方案正式发布
瓴羊X阿里云上的Salesforce联合解决方案正式发布
|
3月前
|
NoSQL 安全 MongoDB

相关产品

  • 弹性高性能计算