【中国超算迎来最强对手】 IBM推出机器学习加速“瑞士军刀”Power9芯片,性能为同类产品的10倍

简介:

12月6日,据外媒报道,IBM最新一代的Power芯片Power9正在进入市场,以应对越来越强劲的人工智能、机器学习领域高强度、高密度的信息处理需求。

TechCrunch报道称,IBM打算向第三方制造商,比如包括Google在内的云服务商出售该芯片。IBM 近日发布了一款由Power9芯片和AC922芯片组成的新计算机,并打算在IBM云上提供该服务的芯片。

IBM官方的介绍是:POWER9是唯一采用最先进的I / O子系统技术的处理器,包括下一代NVIDIA NVLink,PCIe Gen4和OpenCAPI。 这些接口使POWER9成为内存带宽的高速公路,可以更快速地提供准确的洞察。

e71609f2b2a49a00d194a55d589894e57e89f7f9

与x86比:最大9.5倍I / O带宽;2倍核心高性能;2.6倍RAM支持;1.8倍内存宽带。

IBM认知系统副总裁Brad McCredie解释说:“我们通常把我们的技术作为一个完整的解决方案推向市场。

该公司专门设计了这款新芯片,以提高Chainer,TensorFlow和Caffe等通用AI框架的性能,并宣称能够让这些框架上运行的workloads增加了近4倍

机器学习加速的瑞士军刀

Moor Insights&Strategy的首席分析师Patrick Moorhead认为,这一芯片可以让IBM真正地脱颖而出。 “Power9是一款具有新型系统架构的芯片,针对机器学习中使用的加速器进行了优化。这款芯片由英特尔提供 Xeon CPU和Nervana加速器,英伟达提供 Tesla 加速器。 IBM的 Power9 实际上是 ML 加速的瑞士军刀,因为它支持的IO和带宽几乎是天文数字,是今天任何同类产品的10倍。“Moorhead说。

如果你知道英伟达已经把控了大量的AI/机器学习workloads,IBM也注意到了,两家公司在GPU芯片上的合作十分紧密。McCredie透露,IBM已经建立了一个系统总线,能够在两种芯片类型之间转移workloads,比竞争系统快得多。

4c522255d2e5186c2cad3a8f396ab7a7f793f83f

“现代workloads正在加速,Nvidia GPU是一个通用的加速器。我们已经看到了这个趋势。我们与他们建立了深厚的关系,Power系统和GPU也建立了合作关系。我们有一个独特的总线,在处理器和GPU之间运行,比竞争系统上多10倍的峰值带宽”,McCredie解释说。

神威·太湖之光最强对手出现,中国超算世界第一的宝座面临威胁

根据TechCrunch的报道,这些新芯片将用在Lawrence Livermore和美国橡树岭国家实验室正在开发的被称为Summit 的超级计算机。

McCredie 说,超级计算机将建在成千上万的 Power9 计算机之上,耗资3.25亿美元,关于这款新的芯片在商业上的一个小爆发似乎已经呼之欲出了。

大名鼎鼎的 Summit 正是美国用来争夺超算TOP 500榜首位置的有力武器。自天河二号和“神威·太湖之光”相继问世以来,中国已经把持了超算TOP500榜单冠军9次。此前有媒体爆料称Summit超级计算机交付的峰值性能将达到200PFlops,远超中国神威太湖之光。 

2017世界超算大会SC17上,Summit并没有如大家预料的那样交付。所以2017年,中国超算“神威·太湖之光”和“天河二号”占据了TOP500榜单前两名。此外,大会期间公布的第50次Top500榜单最新上,中国上榜的超级计算机数量超过了美国,总数达到202台(美国是143),这也是迄今中国上榜 Top500 数量最多的一次,相比之下,美国上榜的超级计算机数量已经降至25年来最低水平。

HPC研究总监,Gartner的机器学习和新兴计算技术部门的Chirag Dekate表示,这个版本是IBM积极布局像人工智能这样的高增长细分市场的一个延续。“通过整合诸如人工智能(特别是机器学习和深度学习)等细分市场的策略,IBM可以更好地在超大规模数据中心和更广泛的市场数据中心方面展开竞争。这有可能为IBM带来直接的收入,并支持新的大规模数据中心的部署”,Dekate解释说。


原文发布时间为:2017-12-7

本文作者:全月

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【中国超算迎来最强对手】 IBM推出机器学习加速“瑞士军刀”Power9芯片,性能为同类产品的10倍

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
481 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
4月前
|
机器学习/深度学习 Python
机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况
本文介绍了机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况,而ROC曲线则通过假正率和真正率评估二分类模型性能。文章还提供了Python中的具体实现示例,展示了如何计算和使用这两种工具来评估模型。
160 8
|
5月前
|
机器学习/深度学习 缓存 监控
利用机器学习优化Web性能和用户体验
【10月更文挑战第16天】本文探讨了如何利用机器学习技术优化Web性能和用户体验。通过分析用户行为和性能数据,机器学习可以实现动态资源优化、预测性缓存、性能瓶颈检测和自适应用户体验。文章还介绍了实施步骤和实战技巧,帮助开发者更有效地提升Web应用的速度和用户满意度。
|
5月前
|
机器学习/深度学习 数据挖掘 Serverless
手把手教你全面评估机器学习模型性能:从选择正确评价指标到使用Python与Scikit-learn进行实战演练的详细指南
【10月更文挑战第10天】评估机器学习模型性能是开发流程的关键,涉及准确性、可解释性、运行速度等多方面考量。不同任务(如分类、回归)采用不同评价指标,如准确率、F1分数、MSE等。示例代码展示了使用Scikit-learn库评估逻辑回归模型的过程,包括数据准备、模型训练、性能评估及交叉验证。
246 1
|
5月前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
|
6月前
|
数据可视化 Swift
小钢炮进化,MiniCPM 3.0 开源!4B参数超GPT3.5性能,无限长文本,超强RAG三件套!模型推理、微调实战来啦!
旗舰端侧模型面壁「小钢炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能。并且,量化后仅 2GB 内存,端侧友好。
小钢炮进化,MiniCPM 3.0 开源!4B参数超GPT3.5性能,无限长文本,超强RAG三件套!模型推理、微调实战来啦!
|
8月前
|
测试技术
8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法
【7月更文挑战第8天】北京大学等研究者提出的新方法缓解了大模型如Llama-3-8B在持续预训练时的“稳定性差距”,通过多轮次训练、高质量子语料库选择和数据混合策略,提升性能和效率。在医疗领域,他们将OpenLlama-3B性能提升至40.7%,并创建的Llama-3-Physician模型达到GPT-4级别。尽管取得突破,该方法在其他模型和领域的适用性仍需探索,且持续预训练仍资源密集。[链接: https://arxiv.org/abs/2406.14833]
123 25
|
8月前
|
机器学习/深度学习 数据采集 运维
智能化运维:利用机器学习优化系统性能
在当今快速发展的信息技术时代,传统的运维方式已难以满足日益增长的业务需求和复杂性。本文将探讨如何通过机器学习技术来提升运维效率,确保系统的高可用性和性能优化。我们将深入分析机器学习模型在预测系统负载、自动故障检测与响应以及资源分配中的应用,并讨论实施这些策略时可能遇到的挑战和解决思路。
|
8月前
|
机器学习/深度学习 算法 前端开发
集成学习(Ensemble Learning)是一种机器学习技术,它通过将多个学习器(或称为“基学习器”、“弱学习器”)的预测结果结合起来,以提高整体预测性能。
集成学习(Ensemble Learning)是一种机器学习技术,它通过将多个学习器(或称为“基学习器”、“弱学习器”)的预测结果结合起来,以提高整体预测性能。
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】Transformer模型大小与性能探究
【机器学习】Transformer模型大小与性能探究
432 5

热门文章

最新文章