NVIDIA携大型台湾服务器制造商:为推AI数据中心设计方案

简介:

NVIDIA于本周二正式宣布与世界四家大型计算机制造商签署协议,双方将采用由NVIDIA方面提供的图形芯片支持型服务器设计方案,从而支持各类要求极高的“超大型”数据中心内的人工智能相关工作负载。

 英伟达公司携手大型台湾服务器制造商,旨在进一步推广AI数据中心设计方案

此次与NVIDIA合作的原始设计制造商(简称ODM厂商)为四家来自台湾的计算机及其它电子产品制造商,其中包括鸿海精密工业有限公司(亦被称为富士康)、英业达公司、广达电脑公司以及纬创公司。它们将成为NVIDIA合作伙伴计划中的一部分,并有资格率先体验由NVIDIA图形处理单元(简称GPU)负责支持的HGX架构设计(如上图所示)。

根据本周于台北Computex大会上公布的消息,这套数据中心设计方案与微软公司内部的Olympus项目、Facebook的Big Basin系统以及NVIDIA自家的DGX-1超级计算机完全相同。NVIDIA方面此前已经面向Amazon Web Services等云计算供应商提供类似的项目,但这一次是其首度将架构开放给ODM厂商。

NVIDIA加速计算产品高级主管Keith Morris在接受采访时表示,该公司希望交付一套超大规模数据中心标准,旨在帮助各ODM厂商将NVIDIA技术方案纳入自家体系,从而更高更高效地实现产品上市。

Morris解释称,“我们正在试图实现AI民主化。”尽管他没有明确静态,但NVIDIA无疑正在努力保证其图形芯片始终在AI工作负载领域扮演核心角色——特别是考虑到英特尔甚至谷歌等竞争对手正不断向AI领域投入其它类型的芯片方案。总而言之,NVIDIA正在积极寻求可行途径,希望借此防止制造商大量使用可能冲击其市场份额的其它定制化芯片设计方案。

而在此次合作消息公布之前,NVIDIA刚刚于5月10号在其GPU技术大会上亮出一款针对人工智能进行优化的全新芯片,其高度关注深度学习神经网络并旨在实现自动驾驶车辆以及即时语言翻译等最新突破性应用。这款基于全新Volta架构的芯片能够在单一大型晶片之上封装约2100亿个晶体管。与NVIDIA的上代芯片相比,这款尺寸与Apple Watch类似的芯片能够将深度学习的执行速度提升约12倍。

今年第三季度将有一款采用这款芯片的全新NVIDIADGX-1超级计算设备正式投放市场,价格为14万9千美元; 而到今年第四季度,该芯片也将随同其它服务器制造商的产品一同推出。

NVIDIA表示,其HGX参考设计旨在满足超大规模云环境需求。其能够通过多种方式实现配置,将GPU与CPU相结合以实现高性能计算,同时可以对深度学习神经网络进行训练与运行。NVIDIA方面同时补充称,HGX亦面向云服务供应商长久以来所期盼的GPU云平台——该平台提供一系列开源深度学习框架,具体包括TensorFlow、Caffe2、Cognitive Toolkit以及MXNet。

纬创公司企业业务部门总裁兼首席技术官Donald Hwang在一份声明中指出,客户“渴望利用更多GPU计算能力以处理各类AI工作负载,通过这种新的合作关系,我们将能够更快提供此类新型解决方案。”

NVIDIA近年来的市场表现一直不错,这主要是由于其图形芯片已然成为AI类工作负载的核心支柱。根据今年5月9日发布的财报,其第一财季利润额度高于预期,达到上年同期的两倍以上。而消息发布之后,投资者们亦热烈响应,直接令NVIDIA的股价上涨达14%。


原文发布时间为:2017年5月31日

本文作者:孙博 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
3月前
|
存储 人工智能 运维
龙蜥副理事长张东:加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统
操作系统如何满足 AI 应用场景需求?未来发展趋势如何?
|
6天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
50 11
|
16天前
|
存储 人工智能 算法
加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统 | 2024龙蜥大会主论坛
本次方案的主题是加速推进 AI+OS 深度融合,打造最 AI 的服务器操作系统,从产业洞察、创新实践、发展建议三个方面,指出 AI 原生应用对操作系统提出更高要求,需要以应用为导向、以系统为核心进行架构创新设计,要打造最 AI 的服务器操作系统。 1. 产业洞察 2. 创新实践 3. 发展建议
|
2月前
|
存储 人工智能 自然语言处理
ChatMCP:基于 MCP 协议开发的 AI 聊天客户端,支持多语言和自动化安装 MCP 服务器
ChatMCP 是一款基于模型上下文协议(MCP)的 AI 聊天客户端,支持多语言和自动化安装。它能够与多种大型语言模型(LLM)如 OpenAI、Claude 和 OLLama 等进行交互,具备自动化安装 MCP 服务器、SSE 传输支持、自动选择服务器、聊天记录管理等功能。
217 15
ChatMCP:基于 MCP 协议开发的 AI 聊天客户端,支持多语言和自动化安装 MCP 服务器
|
2月前
|
存储 弹性计算 运维
端到端的ECS可观测性方案,助力云上业务安全稳定
本文介绍了云原生时代保障业务系统可靠性的方法和挑战,重点探讨了阿里云ECS在提升业务稳定性、性能监控及自动化恢复方面的能力。文章分为以下几个部分:首先,阐述了业务可靠性的三个阶段(事前预防、事中处理、事后跟进);其次,分析了云上业务系统面临的困难与挑战,并提出了通过更实时的监测和自动化工具有效规避风险;接着,详细描述了ECS实例稳定性和性能问题的解决方案;然后,介绍了即将发布的ECS Lens产品,它将全面提升云上业务的洞察能力和异常感知能力;最后,通过具体案例展示了如何利用OS自动重启和公网带宽自适应调节等功能确保业务连续性。总结部分强调了ECS致力于增强性能和稳定性的目标。
|
30天前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
30天前
|
人工智能 弹性计算 运维
ECS控制台,AI助手与极简管控体验
本文介绍了ECS控制台的演进及最新AI工具功能。控制台作为运维平台,需兼顾用户体验、可靠性和安全性。针对不同用户(个人开发者、企业级用户、资源管理员和架构师),控制台提供了定制化AI助手,涵盖售前选型、售中购买、售后运维等全链路支持。AI助手可智能分析用户需求,推荐合适规格,并提供实例诊断、命令解释等功能,简化操作流程。此外,还推出了简洁版控制台,优化了小资源量用户的使用体验,减少复杂度,提升效率。未来,控制台将朝着更智能、个性化的chat ops方向发展。
|
30天前
|
存储 人工智能 芯片
面向AI的服务器计算互连的创新探索
面向AI的服务器计算互连创新探索主要涵盖三个方向:Scale UP互连、AI高性能网卡及CIPU技术。Scale UP互连通过ALink系统实现极致性能,支持大规模模型训练,满足智算集群需求。AI高性能网卡针对大规模GPU通信和存储挑战,自研EIC网卡提供400G带宽和RDMA卸载加速,优化网络传输。CIPU作为云基础设施核心,支持虚拟化、存储与网络资源池化,提升资源利用率和稳定性,未来将扩展至2*800G带宽,全面覆盖阿里云业务需求。这些技术共同推动了AI计算的高效互联与性能突破。
|
3月前
|
存储 人工智能 弹性计算
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
90 6
|
3月前
|
安全 数据中心
数据中心服务器机架是什么
数据中心服务器机架是用于容纳服务器、存储器等IT设备的结构,旨在提升数据中心的管理与运营效率。常见的类型包括开放式机架、封闭式机柜和壁挂式机架,每种类型各有特点,适用于不同的场景需求。选择时需考虑尺寸、承重、冷却效率及安全性等因素,以确保最佳的使用效果。
122 4

热门文章

最新文章