AMD Instinct扩大生态系统 为HPC和AI应用程序提供Exascale级技术

简介: AMD Instinct扩大生态系统 为HPC和AI应用程序提供Exascale级技术

3月22日,AMD宣布正式发布AMD Instinct生态系统,其中包括ASUS、Dell Technologies、HPE、Lenovo以及Supermicro在内更广泛的系统支持合作伙伴、全新AMD Instinct MI210加速器以及具备强大功能的ROCm 5软件。结合以上新特性和产品,AMD Instinct以及ROCm生态系统正在为拥有广泛基础的HPC和AI客户提供Exascale级(百亿亿次级)技术,以满足计算加速的数据中心工作负载日益增长的需求,并缩短洞察和发现的时间。


AMD数据中心GPU与加速处理全球副总裁Brad Mccredie表示:“与前代加速器相比,其适用平台增加了一倍,客户在HPC和AI应用程序中的采用率也越来越高,随着商业ISV合作伙伴在关键工作负载中所提供的新支持,我们进一步推动了AMD Instinct MI200加速器以及ROCm 5软件生态系统的采用。现在,随着MI200系列中AMD Instinct MI210加速器的正式推出,无论是为大规模HPC和AI工作负载提供业界领先的加速处理,亦或是通过商业业态获得Exascale级技术支持,我们的客户均可以为他们的工作负载选择最适合的加速器。”


Lumi超级计算机基础设施主管Pekka Manninen说:“基于AMD EPYC处理器和AMD Instinct MI200加速器的Lumi超级计算机将为大规模模拟和建模以及AI和深度学习工作负载提供跨代际般的性能飞跃,以解决研究中的棘手难题。我们已经通过AMD Instinct MI210加速器切身体验到Instinct MI200系列的强大性能,以帮助我们的科学家在Lumi全面部署后,在应对运行中所面临的诸多挑战与复杂性项目时做好准备。”

为未来HPC和AI提供动力

AMD Instinct MI200系列加速器旨在为Exascale级系统的探索提供动力,以帮助研究人员、科学家和工程师解决那些从气候变化到疫苗研究中的紧迫挑战。AMD Instinct MI210加速器则专为需要PCIe规格下卓越HPC和AI性能的客户提供Exascale级技术。基于AMD CDNA 2架构,AMD Instinct MI210加速器扩大了AMD在PCIe 外形规格卡上双精度(FP64)计算的性能领导力。它们还拥有基于AMD Matrix Core技术的广泛混合精度能力,为加速深度学习训练提供一个强大的解决方案。

推动ROCm的采用

作为一个开放的软件平台,AMD ROCm平台基于众多应用程序和库之上,并可为顶级HPC和AI应用程序提供强大性能,以帮助研究人员、科学家和工程师可以借助AMD Instinct加速器的性能推动科学发现。

通过ROCm 5,AMD进一步扩大了其软件平台,新增了对AMD Instinct MI200系列加速器以及AMD Radeon PRO W6800专业显卡的硬件支持,再加上对Red Hat Enterprise Linux 8.5的支持,不仅提高了开发者对ROCm的可用性,还在各种关键负载中实现了更出色的性能。


此外,通过在AMD GPU上进行移植和优化的开源应用程序资源中心AMD Infinity Hub,终端用户得以轻而易举地找到、下载并安装容器化HPC应用程序和ML框架。AMD Infinity Hub应用容器旨在减少获取和安装软件时的传统难题和困难,同时让用户根据共享的经验和问题解决办法来获得帮助。

不断扩大的合作伙伴和客户生态系统

随着越来越多的专业应用程序通过ROCm和AMD Instinct加速器进行优化,AMD进一步扩大了其软件生态系统,新增了包括Ansys Cascade Technologies以及TempoQuest在内的商业ISV合作伙伴。这些ISV合作伙伴可为包括计算流体力学(CFD)、气象、计算机辅助工程(CAE)在内的加速工作负载提供应用程序。除了以上更新,ROCm现有的应用程序支持还包括HPC、AI和机器学习应用程序,以及AMBER、Chroma、CP2K、GRID、GROMACs、LAAMPS、MILC、Mini-HAAC、NAMD、NAMD 3.0、ONNX-RT、OpenMM、PyTorch、RELION、SPECFEM3D Cartesian、SPECFEM3D Globe和TensorFlow。

 

AMD还与诸如包括ASUS、Dell Technologies、HPE、Lenovo、Supermicro在内的合作伙伴以及Colfax、Exxact、KOI Computers、Nor-Tech、Penguin和Symmetric等系统集成商合作提供差异化解决方案以应对下一代计算挑战。众多超级计算机客户也已经开始充分利用这些新客户成功案例所带来的优势,例如橡树岭国家实验室、KTH/Dardel、CSC/LUMI以及Cines/Adastra。


为客户和合作伙伴提供优质服务

AMD Accelerator Cloud可为客户提供可远程访问并评估AMD Instinct加速器和AMD ROCm软件的环境。无论是移植遗留代码、对应用程序进行基准测试,还是测试多GPU或多节点扩展,AMD Accelerator Cloud都可以让潜在客户和合作伙伴快速、轻而易举地获取最新GPU和软件。AMD Accelerator Cloud还可被用于支持各种活动,例如为现有或潜在的客户提供黑客马拉松和ROCm培训课程,帮助开发者提升他们的技能并学习如何最大程度的利用AMD Instinct加速器。


MI200系列参数

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
22小时前
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
|
22小时前
|
人工智能 NoSQL atlas
Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用
一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用
|
22小时前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
|
22小时前
|
人工智能 自然语言处理 搜索推荐
阿里通义千问的这次升级不仅带来了实实在在的利好,也为我们展示了AI技术的巨大潜力和广阔前景
【5月更文挑战第13天】阿里通义千问3月22日升级,开放1000万字长文档处理功能,成为全球处理容量最大的AI应用,超越ChatGPT等。此升级助力用户(如金融分析师、法律人士、科研人员)高效处理文档,提升工作效率,并推动AI在各行业深入应用,加速数字化转型。未来,通义千问可能发展更强大的自然语言处理能力、拓宽应用场景及提供智能个性化推荐,展现AI技术潜力与前景。
14 2
|
22小时前
|
存储 机器学习/深度学习 人工智能
新一代数据库技术:融合AI的智能数据管理系统
传统数据库管理系统在数据存储和查询方面已经取得了巨大的成就,但随着数据量的不断增长和应用场景的多样化,传统数据库已经难以满足日益增长的需求。本文将介绍一种新一代数据库技术,即融合了人工智能技术的智能数据管理系统。通过结合AI的强大能力,这种系统能够实现更高效的数据管理、更智能的数据分析和更精准的数据预测,为用户带来全新的数据管理体验。
|
22小时前
|
机器学习/深度学习 人工智能 算法
构建高效AI系统:深度学习优化技术解析
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中,如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略,如自适应学习率调整、梯度累积技巧以及正则化方法,并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析,还结合实例说明如何在实际项目中应用这些优化技术。
|
22小时前
|
机器学习/深度学习 人工智能 自然语言处理
构建未来:AI在持续学习系统中的创新应用
【5月更文挑战第11天】 随着人工智能(AI)技术的飞速发展,其在教育领域的应用日益增多。特别是在持续学习系统(Lifelong Learning Systems, LLS)中,AI技术正开启着个性化和适应性教学的新篇章。本文聚焦于AI在LLS中的创新应用,探讨了机器学习、自然语言处理和认知建模等关键技术如何共同作用于构建智能化的学习环境。文章旨在分析当前AI技术在持续学习领域的最新进展,并展望其对未来教育模式的影响。
|
22小时前
|
机器学习/深度学习 人工智能 算法
构建未来:AI驱动的自适应网络安全防御系统
【5月更文挑战第11天】在数字时代的风口浪尖,网络安全问题日益凸显。传统的安全防御手段在应对不断进化的网络威胁时显得力不从心。本文提出了一个基于人工智能技术的自适应网络安全防御系统框架,旨在通过实时分析、学习和预测网络行为,自动调整防御策略以抵御未知攻击。系统采用先进的机器学习算法和大数据分析技术,能够在保持高效性能的同时,最小化误报率。文章详细阐述了系统的设计理念、关键技术组件以及预期效果,为网络安全的未来发展方向提供新思路。
|
22小时前
|
机器学习/深度学习 人工智能 自动驾驶
构建未来:AI在持续学习系统中的创新应用
【5月更文挑战第11天】 在人工智能的迅猛发展浪潮中,一个不断进化的分支便是AI在持续学习系统中的应用。本文旨在探讨AI技术如何革新持续学习系统,并分析其在不同领域的创新实践。文章首先界定了持续学习系统的概念,随后深入解析了深度学习、强化学习以及转移学习等关键技术在其中的作用。通过案例分析,展示了这些技术如何在医疗诊断、自动驾驶及个性化教育中发挥至关重要的角色。最终,讨论了面临的挑战与未来的发展趋势,为读者提供了一个关于AI在持续学习领域未来可能展开的蓝图。
6 1
|
人工智能
这个AI启动声称自动化应用程序制作,但实际上只是使用人类
这个AI启动声称自动化应用程序制作,但实际上只是使用人类
这个AI启动声称自动化应用程序制作,但实际上只是使用人类

热门文章

最新文章