性价比提升50%,阿里云HPC优化实例hpc8ae正式商业化

简介: hpc8ae实例,CAE场景算力的最佳选择。

【阅读原文】戳:性价比提升50%,阿里云HPC优化实例hpc8ae正式商业化


近日,全球领先的云计算厂商阿里云宣布正式开启最新HPC优化实例hpc8ae的商业化发布,该实例依托阿里云自研的「飞天+CIPU」架构体系,搭载第四代AMD EPYC处理器,专为高性能计算应用优化,特别适用于计算流体、有限元分析、多物理场模拟等仿真类应用,CAE场景下的性价比最少提升50%。

 

从分析地震资料、勘探石油储藏,到使用计算流体力学设计汽车外形降低风阻,再到通过分子动力学模拟来发现新的药物靶点、攻克疾病。过去很多年,高性能计算无所不在,在各个领域,都在帮助我们解决各种各样、大型的、复杂的计算问题,促进社会的技术进步和创新发展。传统高性能计算和人工智能、VR、5G等新兴领域的爆发式发展,对算力的需求越来越高。

 

传统的线下HPC存在建设周期长、计算资源不足和性能落后等诸多问题,难以满足企业的研发创新需求。基于云计算的Cloud HPC,更加敏捷,能够使用最新的、多样性化的硬件,灵活的按照业务动态的增加或减少资源,更具成本效益。

 

阿里云高性能计算产品负责人黄泽辉表示:“阿里云一直以来,坚定地投入Cloud HPC方向,不断的革新计算技术,为HPC应用负载专门设计和优化云的基础设施,并通过端到端的HPCaaS云产品帮助任意规模的用户,以最简单的方式,来使用最强大的高性能计算。本次hpc8ae实例的发布,代表着阿里云在普惠高性能的Cloud HPC路上更进一步,为行业客户不断的降本增效。”

 

 

算力强劲,CAE 场景算力的最佳选择

 

HPC优化实例hpc8ae针对高性能计算应用进行了深度优化。在关键参数上,hpc8ae实例最高主频3.75Ghz、内存带宽500GB/s ,提供了更加稳定的物理核心,不支持启用超线程。通过阿里云自研的CIPU架构将算力损耗降为“0”,存储的I/O性能、实例的网络能力都全面提升,HPC、通用计算、大数据、AI等场景都能从中获得20%以上的性能提升。

 

 

图丨hpc8ae实例的benchmark性能测试

 

在WRF、STAR-CCM+、Fluent等常见工业仿真软件的性能benchmark测试中,相较于第八代通用计算实例,专门优化的hpc8ae实例在单节点作业中性能普遍提升30%以上;在超过512核的多节点作业中,STAR-CCM+的计算扩展效率也接近线性,具有很好的并行加速效果。

 

基于eRDMA网络,打造云上低延时、低抖动网络集群

 

众所周知,HPC类应用对于网络的性能需求(如延迟、吞吐)很高,TCP/IP的网络通信性能成为瓶颈,而传统HPC集群更多采用RDMA网络成本很高,弹性和扩展能力不足。阿里云的eRDMA、是阿里云自研云上弹性RDMA网络,底层链路复用VPC网络,支持0拷贝、bypass操作系统,采用自研的拥塞控制算法,并通过 CIPU卸载网络通信开销,可实现最低8μs的低时延、没有长尾抖动的节点网络通信效果。对于用户的HPC软件应用,eRDMA通过支持libfabric实现兼容,用户无需改动即可直接使用。

 

 

因此,用户可以在阿里云任意可用区,即可实现秒级大规模的RDMA组网,加速并行计算任务。阿里云ECS还提供部署集的能力,保证同一部署集内的hpc8ae实例紧凑放置,可以进一步提升eRDMA的低时延表现。

 

 

E-HPC一键开启云上仿真任务

 

此外,阿里云还为客户提供了功能完善的弹性高性能计算服务E-HPC,客户可一键创建HPC集群,通过最高效的集群管理功能,以最简单易用的方式来使用hpc8ae实例进行云上仿真任务,包括使用SLURM、PBS等常用的调度器,管理和监控HPC作业,自动化的安装和部署软件、使用部署集的能力保证时延等,以提高计算效率,优化计算成本。

 

目前,阿里云E-HPC弹性高性能计算平台已助力众多企业企业缩短研发周期,加快业务创新。其中,帮助上汽乘用车制造仿真效率提升30%,支撑某手机厂商仿真业务性能提升25%。


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
Shell Android开发
Android系统 adb shell push/pull 禁止特定文件
Android系统 adb shell push/pull 禁止特定文件
1496 1
|
数据采集 SQL 数据可视化
大数据可视化技巧:借助PowerBI提升数据故事讲述力
【4月更文挑战第8天】Power BI助力大数据可视化,支持多种数据源连接,如SQL Server、Excel,提供数据清洗与转换功能。通过选择合适图表类型、运用颜色和大小强化表达,创建交互式仪表板。讲述数据故事时,注重故事主线设计,利用叙事技巧引导观众,并添加文本说明。分享已完成报告,提升数据驱动决策能力。动手实践,体验Power BI的强大与易用。
575 0
|
12月前
|
人工智能 自然语言处理 语音技术
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
Step-Audio 是由阶跃星辰团队推出的开源语音交互模型,支持多语言、方言和情感表达,能够实现高质量的语音识别、对话和合成。本文将详细介绍其核心功能和技术原理。
1804 91
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
|
7月前
|
前端开发 JavaScript Java
Java 开发中 Swing 界面嵌入浏览器实现方法详解
摘要:Java中嵌入浏览器可通过多种技术实现:1) JCEF框架利用Chromium内核,适合复杂网页;2) JEditorPane组件支持简单HTML显示,但功能有限;3) DJNativeSwing-SWT可内嵌浏览器,需特定内核支持;4) JavaFX WebView结合Swing可完美支持现代网页技术。每种方案各有特点,开发者需根据项目需求选择合适方法,如JCEF适合高性能要求,JEditorPane适合简单展示。(149字)
865 1
|
6月前
|
人工智能 监控 安全
紧急!!慎用Cursor V1.5.7版本!!!存在恶意大规模攻击用户项目文件行为
Cursor v1.5.7 利用DeepSeek 3.1的架构感知和代码能力,对用户项目文件进行多批次恶意攻击
990 12
|
11月前
|
传感器 算法 Java
基于 pyflink 的算法工作流设计和改造
本文分享了硕橙科技大数据工程师程兴源在Flink Forward Asia 2024上的演讲内容,围绕工业互联网场景下的Flink应用展开。主要内容包括:为何选择Flink、算法工作流设计、性能优化实践、上下游链路协作思考及未来展望。团队通过Flink处理工业设备数据(如温度、振动等),实现故障预测与分析。文章详细探讨了性能优化路径(如批处理、并行度提升)、KeyBy均衡化、内存管理等技术细节,并介绍了数据补全方法和告警规则的设计。最后,对未来基于Flink的编码强化、CEP模式改进及工业数据归因目标进行了展望。
419 7
基于 pyflink 的算法工作流设计和改造
|
JavaScript 前端开发 搜索推荐
Moment.js、Day.js、Miment,日期时间库怎么选?
【10月更文挑战第29天】如果你需要一个功能强大、插件丰富的日期时间库,并且对性能要求不是特别苛刻,Moment.js是一个不错的选择;如果你追求极致的轻量级和高性能,那么Day.js可能更适合你;而如果你有一些特定的日期时间处理需求,并且希望在性能和功能之间取得平衡,Miment也是可以考虑的。
579 57
|
存储 人工智能 大数据
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
内存技术
基于MATLAB的PCM的编码译码仿真
基于MATLAB的PCM的编码译码仿真
919 1
|
自然语言处理 人机交互 API
FunAudioLLM技术测评报告
FunAudioLLM技术测评报告
331 1