9月24日,在中国计算机学会举办的“2024 CCF 全国高性能计算学术年会”中,阿里云弹性高性能计算(E-HPC)荣获「 CCF HPC China 2024 产品创新奖」。这也是继 2022 年之后,阿里云E-HPC 再次荣获此奖项,代表着阿里云在云超算领域的持续创新结果,其产品能力和技术成果得到了业界的一致认可。
在本次大会主论坛中,阿里云智能集团副总裁,弹性计算产品线和存储产品线负责人吴结生带来了题为《AI驱动,阿里云高性能计算的创新和发展》的主题报告,也详细阐述了阿里云的 HPC 行业洞察和技术创新工作。
图:阿里云智能集团副总裁,弹性计算产品线负责人、存储产品线负责人 吴结生
吴结生在报告中提到:面对多样化的高性能计算负载,阿里云应该发挥云计算弹性按需的特点和超大规模资源的优势,通过完整的高性能计算产品矩阵,来加速各行各业的创新活动,发挥 HPC 的最大潜能。其中既包括灵骏智算的专属集群满足 AI/ML 这样的极致紧耦合任务,也包括云上敏捷构建的 E-HPC 集群满足 CAE 等紧密耦合类型任务,还有最大化使用阿里云全球化资源的 Instant 计算服务满足高吞吐量、松耦合的批处理类任务。截至目前国内已超过 80%的科技公司、50%的大模型创业公司都在使用阿里云。
典型案例包括
- 上汽集团:作为国内最早的汽车企业之一,在集团发展上的数字化和智能化升级阶段中,对高性能计算算力和算力质量提出了极高的要求,通过阿里云云上仿真计算的高性能计算服务,帮助上汽在阿里云上实现了全流程仿真计算流程,也帮助上汽提升了仿真计算25%的效率,同时实现了每一年可以开发一辆新车的目标。除此以外,每一年也为上汽节省了约9000万的研发费用。
- 望石智慧:是一家使用人工智能技术驱动新药研发的科技公司。药物计算场景中有“波峰计算算力需求大、平均算力和波峰之间相差大”等显著的特点,其次,他们也需要一个极低成本的高弹性算力。通过阿里云整体的计算资源,使用跨区域资源调度,加之阿里云实现了把闲散的资源利用起来,从而达到了满足望石智慧10万核弹性波峰的需求,同时也帮助其降低成本至原来的1/3。
- 月之暗面: Kimi智能助手APP来源于创业型大模型+AI应用公司月之暗面,目前其组网大模型训练和智能助手业务都跑在阿里云上,阿里云也高效地保障了其大模型训练及AI应用扩展业务。
这些汽车、工业制造、生命科学、能源气象、以及最新的生成式 AI 等客户场景的产品方案落地,背后离不开阿里云从底层硬件到上层服务的全栈技术创新。包括磐久AI计算服务器、高性能存储CPFS、云基础设施服务器芯片CIPU、高性能网络HPN 7.0、弹性RDMA的连接能力、网络拓扑感知等等。以上都得益于全新的 CIPU 体系架构,云上的计算、网络、存储能力得到大幅提升。CIPU 2.0 的推出,将会进一步数据加速的效率。
这些技术创新和架构演进,帮助用户摆脱传统 HPC 的束缚,充分释放创新动力。用户可以完全按应用选择多样性、高性价比的算力,使用云原生的产品服务轻松扩展和运行 HPC 工作负载,仅为使用的资源付费。最重要的是,用户可以享受简单易用、普惠高效的计算服务,而不需要去管理复杂的 IT 基础设施。
我们相信阿里云弹性高性能计算产品在技术上的飞跃,和云超算敏捷、普惠和弹性可扩展的优势,可以成为满足 HPC 用户和应用需求的全新选择,加速研发创新活动。