新品发布|HPC优化实例助力工业制造、生命科学和 EDA 应用加速创新

简介: 2023年云栖大会,阿里云弹性计算面向工业仿真、生命科学和芯片设计等行业,阿里云发布了HPC优化实例系列新品,包括内存带宽优化实例hpc8ae、数据和内存优化实例hpc7ip和计算优化实例hpc8y,全面采用物理核,与通用计算实例相比性能提升40%。

2023年云栖大会,阿里云弹性计算面向工业仿真、生命科学和芯片设计等行业,阿里云发布了HPC优化实例系列新品,包括内存带宽优化实例hpc8ae、数据和内存优化实例hpc7ip和计算优化实例hpc8y,全面采用物理核,与通用计算实例相比性能提升40%。

阿里云已经有非常多样化、最新的实例选择,为什么我们还要再发布 HPC 实例呢?

因为我们都知道 HPC 应用通常具有计算密集、网络密集、内存密集的特点,目前计算类实例是为互联网 web 应用等通用场景设计的,各项性能比较均衡,缺少针对性优化,也没有节点之间的高速互联。而线下带有 IB 网络的HPC的物理器成本很高,也不具备弹性按需扩展的能力。HPC实例就是为云上 HPC 应用专门设计优化的。

我们采用阿里云最新的CIPU 架构,通过专用的神龙 MoC 来提供虚拟化,性能相比物理服务器,基本 0 损耗。并且我们遵从传统 HPC 的用户习惯,直接提供性能稳定可靠、调度优化的物理核,也帮助用户控制软件 license 费用。

CIPU 提供的免费的 eRDMA 网络,100G 的带宽,低至 8us 的时延,满足 HPC 中紧耦合的、MPI 类并行计算任务的联网需求。eRDMA 兼容传统的 IB verbs 语义,用户应用完全无需改造。

在此基础上,我们还针对工业制造、生命科学和 EDA 应用不同的需求,针对性的优化,最大限度提高应用的性能表现,并且优化成千上百机器规模下运行的成本。

工业仿真场景下的最佳选择内存带宽优化实例hpc8ae

工业仿真场景下,流体力学计算(CFD),有限元分析(FEA)等应用都需要更高的主频、更高的内存带宽。我们推出新的 hpc8ae 实例,采用第四代 AMD 的 Genoa 处理器,最高 3.75Ghz 主频,提供 500GB/s 的内存带宽,可以大大提升包括 STAR-CCM+、ANSYS Fluent DYNA 在内应用 40%以上的性能。并且 eRDMA 在用户业务 E2E 的测试中,8 节点的并行效率也能完全满足应用的要求。

生命科学场景下的最佳选择:计算和网络优化实例hpc8y

生命科学场景下,我们推出的 hpc8y 实例使用阿里云自研的 ARM 架构的倚天芯片以及 eRDMA 网络。倚天芯片是天然的物理多核设计,最高可有 128 个物理核,并且针对基因测序、分子动力学模拟等软件提供包括数学库、指令集在内的编译优化错误,在 VASP 上,因为倚天自研的优势,与 x86 服务器相比,我们可以提高 90%的性价比,是非常好的降本增效的选择。

EDA场景下的最佳选择:数据和内存优化实例hpc7ip

在半导体设计 EDA 场景下,我们推出的 hpc7ip 实例具有 2T 的傲腾 AEP 内存。与 DDR 内存相比,既能满足 EDA 应用的性能要求,又能大幅降低成本,很好的满足  EDA 后端仿真中众多内存受限应用的需求。与同样是 2T 内存的 re6 实例相比,hpc7ip 性价比提升 50%以上。

目前,阿里云弹性高性能计算平台已助力众多企业企业缩短研发周期,加快业务创新。其中,助力上汽乘用车新车研发每年节省9000万,为广州智药的新药研发效率提升2.4倍,为Arm中国一周内交付7万+弹性资源。

相关文章
|
4月前
|
人工智能 API 机器人
OpenClaw 用户部署和使用指南汇总
本文档为OpenClaw(原MoltBot)官方使用指南,涵盖一键部署(阿里云轻量服务器年仅68元)、钉钉/飞书/企微等多平台AI员工搭建、典型场景实践及高频问题FAQ。同步更新产品化修复进展,助力用户高效落地7×24小时主动执行AI助手。
29595 253
|
存储 机器学习/深度学习 缓存
Hybrid Model Support:阿里云 Tair 联合 SGLang对 Mamba-Transformer 等混合架构模型的支持方案
阿里云 Tair KVCache 联合 SGLang,创新支持 Mamba-Transformer 等混合架构模型。通过双池内存、状态快照等技术,解决异构状态管理难题,实现前缀缓存与推测解码,显著提升 Qwen3-Next 等模型的推理效率,推动大模型迈向高效智能体时代。
|
7月前
|
算法 大数据 数据挖掘
数据嗅探社会热点:我们靠“感觉”,机器靠“证据”
数据嗅探社会热点:我们靠“感觉”,机器靠“证据”
401 6
|
11月前
|
缓存 自然语言处理 算法
彻底卸载流氓软件教程,亲测有效!流氓软件彻底卸载软件
本文介绍了多款彻底卸载流氓软件的工具,如 Revo Uninstaller Pro、HiBit Uninstaller、Uninstall Tool 和 SoftCnkiller。这些软件具备强制卸载、残留清理、注册表扫描等功能,能有效应对鲁大师、2345 等难以删除的流氓程序。文章还分享了卸载操作步骤及用户使用体验,帮助用户解决电脑中弹窗广告、隐私窃取等问题,提升系统运行效率。
6548 0
彻底卸载流氓软件教程,亲测有效!流氓软件彻底卸载软件
|
存储 弹性计算 编解码
阿里云王志坤:倚天ECS实例为解决算力挑战提供新思路
在2023云栖大会上,阿里云宣布基于倚天710的倚天ECS实例算力再进化,内存频率由4400MHz提升到4800MHz,性能更加强劲。同时,倚天710与全新的CIPU架构协同,可提供更高性能和更低成本的算力服务。
阿里云王志坤:倚天ECS实例为解决算力挑战提供新思路
|
分布式计算 并行计算 调度
基于HPC场景的集群任务调度系统LSF/SGE/Slurm/PBS
在HPC场景中,集群任务调度系统是资源管理和作业调度的核心工具。LSF、SGE、Slurm和PBS是主流调度系统。LSF适合大规模企业级集群,提供高可靠性和混合云支持;SGE为经典开源系统,适用于中小规模集群;Slurm成为HPC领域事实标准,支持多架构和容器化;PBS兼具商业和开源版本,擅长拓扑感知调度。选型建议:超大规模科研用Slurm,企业生产环境用LSF/PBS Pro,混合云需求选LSF/PBS Pro,传统小型集群用SGE/Slurm。当前趋势显示Slurm在TOP500系统中占比超60%,而商业系统在金融、制造等领域保持优势。
3278 32
|
人工智能 安全 搜索推荐
阿里云AI Stack,加速大模型创新应用
阿里云AI Stack作为面向企业级客户的轻量化、极致性价比、软硬一体AI解决方案,顺利通过了中国信通院《AI大模型一体机技术能力要求》测评。
2308 1
|
负载均衡 监控 API
dotnet微服务之API网关Ocelot
Ocelot 是一个基于 .NET 的 API 网关,适用于微服务架构。本文介绍了如何创建一个 Web API 项目并使用 Ocelot 进行 API 请求路由、负载均衡等。通过配置 `ocelot.json` 和修改 `Program.cs`,实现对 `GoodApi` 和 `OrderApi` 两个项目的路由管理。最终,通过访问 `https://localhost:7122/good/Hello` 和 `https://localhost:7122/order/Hello` 验证配置成功。
480 1
dotnet微服务之API网关Ocelot
|
机器学习/深度学习 算法 vr&ar
《探索图像处理的无限可能:从技术突破到未来应用》
在数字化时代,图像处理技术已成为关键领域,深刻影响着各行各业。从深度学习的融合到图像增强与修复,再到移动设备的实时处理及医疗应用,图像处理不仅提升了图像质量和安全性,还推动了AR、VR等技术的发展。面对挑战,未来图像处理将在智能安防、交通等领域展现更大潜力,继续引领科技创新与变革。
316 3
|
JavaScript 数据管理 编译器
揭秘 ArkTS 的五大优势:如何让鸿蒙系统开发更高效、更简单?
【10月更文挑战第18天】ArkTS是专为鸿蒙系统设计的开发语言,结合了TypeScript的类型系统,并在分布式开发、UI开发、性能优化和API支持等方面进行了优化。它提供了一系列专门的API和语法糖,简化多设备协同开发,支持高效能和低功耗,助力开发者充分利用鸿蒙系统的分布式架构和强大功能。
1142 5

热门文章

最新文章