科技云报道:DPU大热背后,NVIDIA的思考和布局

简介: 为何是软硬一体?

科技云报道原创。

DPU火了,火的猝不及防又理所当然,甚至可以说DPU是当前芯片行业最热的方向,没有之一。

image.png

DPU为什么火了?DPU大热背后,是概念炒作还是需求驱动?要回答这个问题,还是得从DPU的价值说起。

DPU,即Data Processing Unit的缩写,直译为数据处理单元。简单总结DPU的三大价值,即卸载、加速、隔离。

卸载,原本需要消耗大量CPU资源却不一定能完成好的服务,比如网络的虚拟交换、虚拟路由,存储的RDMA、NVMe,安全的防火墙、加解密等。

加速,原本需要通过软件并在CPU里运行的一些应用和服务,也就是近些年常听到的“硬件加速”。

隔离,即与CPU运行的任务进行隔离,保证CPU任务的性能和安全性。

其实从DPU的价值定位不难看出,DPU的核心价值主要是在弥补CPU的不足。

事实上,DPU已经不是第一个为弥补CPU能力不足而发扬光大的产品,多年前GPU的大热也是为了弥补CPU在图形处理能力方面的短板。

换句话说,从CPU、GPU再到今天的DPU,技术变革背后体现的其实是时代的变化、用户需求的变化。

伴随数字经济时代的到来,大量数据无法有效及时处理,而这意味着数据蕴藏的价值无法变现。

与此同时,摩尔定律失效,CPU能力增长见顶,而基础架构由硬转软,虚拟化、云计算大规模普及又消耗了大量的CPU资源。

两股力量共同催生、推动新的技术来填补空缺。在这样的大背景下,DPU应需而来,并迅速获得市场认可。

因此,无论GPU还是DPU的出现都是一种必然,是用户需求倒逼技术革新的结果。

未来还可能会出现XPU,但目的只有一个,即更好的支撑数字经济时代的发展。

百家争鸣,谁能笑到最后?

数字经济,毫无疑问的大市场。

巨大的市场需求推动越来越多的玩家进入DPU市场。其中,既有传统芯片巨头如NVIDIA、AMD,也有阿里、华为等云玩家,还有大量新兴创业玩家。据不完全统计,国内致力DPU领域的创业公司有几十家,好不热闹。

出发点不同、技术实力不同,打造的产品解决方案、致力的目标自然不尽相同。

截至当前,DPU领域的玩家大致分为几类,有专注在通用解决方案的,有聚焦在不同使用场景的,如网络、存储、安全等,也有只服务自己生态的。

目前,DPU还处于发展初期,即风口期,我们还无从判断谁能笑到最后。

但透过考量芯片的重要指标,不难去做一些推断,研发芯片最重要的两个维度:一是产品本身,能否满足时代的需求;二是生态,即软件、开发环境和合作伙伴,众所周知,没有生态支撑,芯片只是一粒粒沙子。

两个维度涉及到两方面的实力,一是企业研发实力如何,二是聚合生态的能力如何?

显而易见,只有能顺应用户需求,并有坚强实力做后盾的玩家才有可能决胜到最后,NVIDIA无疑是其中之一。

之所以作出这样的判断,一是底蕴,NVIDIA是做芯片起家的,GPU领域是绝对的王者,进军DPU领域,属于顺理成章;二是格局,GPU领域,NVIDIA搞的就不单是产品,而是生态,有硬件、有软件、有开发环境、有合作伙伴,进军DPU,轻车熟路。

事实也确实如此,尽管业界DPU玩家的起步时间差不多,但NVIDIA当前已经基本完成了在DPU领域的布局,软硬一体,生态优先。

下面详细解读一下NVIDIA在DPU领域的布局。

**
软硬一体,打造的是体系
**
同GPU一样,NVIDIA DPU从一开始的定位就不是专用,不是服务于某几个场景,而是数字经济的整个星辰大海。

可以用几个关键词来总结NVIDIA DPU的特质:通用、软硬一体、开放、生态优先。一样一样展开,先看产品。

硬件:NVIDIA BlueField,可以通过对各种高级网络、存储和安全业务进行卸载、加速和隔离,可为云、数据中心或边缘计算等环境中的各种工作负载提供安全加速。

根据使用场景的不同,NVIDIA还可提供BlueField-3 DPU、BlueField-2 DPU及NVIDIA融合加速器多种不同的产品。

软件:NVIDIA NGC目录中提供了NVIDIA DOCA软件框架。

image.png

特别值得一提的是,DOCA是NVIDIA为DPU量身打造的软件框架,开发者可以利用DOCA创建高性能、软件定义、云原生、DPU加速的服务,以便对面向未来的数据中心基础设施进行编程。

与此同时,NVIDIA还提供Morpheus软件。作为一个 AI 应用程序框架,Morpheus可为网络安全开发者提供高度优化的AI 流程和预训练的AI 功能,使网络安全开发者能够快速检测和处理安全威胁。

除此之外,经过NVIDIA认证系统认证的NVIDIA EGX平台可提供出色的多节点扩展能力。

从硬件、软件,到开发环境、集成平台,显而易见,NVIDIA不只是专注在研发本身,更愿意赋能,把DPU的能力带给更多的企业、更多的开发者,让更多人享受到DPU的红利。

事实上,为了推动DPU的发展,NVIDIA当前已经落地了非常多有建设性的举措。

比如,2022年初,NVIDIA就授权丽台(上海)信息科技有限公司和上海信弘智能科技有限公司两家合作伙伴设立DPU& DOCA卓越中心,为DOCA中国开发者提供在线实践的免费开发环境,实现编译、运行、测试DOCA应用程序。

另外,在2022年初,NVIDIA还举办了首届DPU中国黑客松竞赛,以赛促学、以赛促发展。

很快在10月,NVIDIA还将举办秋季DPU黑客松比赛,本次竞赛旨在帮助开发者通过 NVIDIA DOCA 软件框架构建创新的 RDMA 加速存储与 AI 应用程序,基于 NVIDIA BlueField DPU与 NVIDIA InfiniBand 网络实现存储、AI 卸载、加速和隔离功能,引领新一代人工智能就绪的基础设施,驱动未来 AI 工厂,欢迎关注。

除了构建软硬一体的产品生态,在合作伙伴生态构建方面,NVIDIA同样下足了力气,除了提供NVIDIA DOCA软件框架供开发者学习使用,还积极与生态伙伴打造面向最终用户的解决方案。

下面透过几个案例来分析NVIDIA DPU真正能带给用户的价值。

中国移动,三大运营商之一,基于Nuage Network和NVIDIA共同打造的SDN 解决方案,显著提高了网络性能,提升了用户满意度。

与单独在软件中运行 OVS-DPDK相比, Nuage Networks VSP和 NVIDIA硬件加速vDPA的联合解决方案使得网络吞吐量增加了1.5倍,数据包转发速度加快了3倍,Apache基准测试每秒支持的请求数增加了7倍。

UCloud,中国云计算第一股。从2018 年起,UCloud开始积极探索基于 NVIDIA BlueField DPU 的高性能的裸金属物理云方案。

截止当前,依托NVIDIA BlueField DPU ,UCloud裸金属物理云方案在网络和存储方面都达到了行业领先水平。

数据为证,UCloud裸金属服务基于 NVIDIA BlueField-2 DPU 可实现99.999999%的数据持久性,并将 IO 时延降低至100微秒,可用性提升至99.95%。

同时由于实现了IO 数据的零拷贝,UCloud UDisk RSSD云盘性能提升至少 20%,单盘4k IOPS 高达75w,带宽高达3GB/s。

网易数帆,网易旗下数字化转型技术及服务供应商。

网易数帆裸金属服务器解决方案利用NVIDIA BlueField DPU不但实现与现有 VPC的兼容互通和协同,而且还将网络相关的工作负载从裸金属服务器主机CPU卸载,释放宝贵的硬件资源给关键业务应用,并实现裸金属服务器网络部署接入的性能加速。

从硬件、软件到社区,再到伙伴,NVIDIA打造的是一个体系,目标是服务整个数字经济时代。

NVIDIA希望通过赋能的方式,将DPU的能力带给更多的企业、更多的开发者,让更多人享受到DPU的红利,而不是将自己局限于产品解决方案供应商这一身份。

能提供价值才是硬道理

DPU市场目前还处于春秋战国时代,谈胜负为时尚早。

可以肯定的是市场足够大,毕竟数字经济时代,数据为王,要想数据发挥出最大的价值,离不开计算。这也是为什么那么多企业涌入这条赛道的原因。

与此同时,历史也在告诉我们,芯片不是一个能快速变现的产业。

这意味着想赚快钱基本是不可能的,只有把更多精力专注在为用户提供价值上,才有可能笑到最后。用这一条去衡量DPU市场的玩家,能满足条件的其实并不多。

为了让广大用户更深入了解DPU,9月19日,2022 GTC大会即将在线上召开,届时NVIDIA将带来一系列关于DPU的分享, 还会有观看派对(Watch Party)特别环节,由 NVIDIA 本地专家主持,中文讲解并实时答疑,欢迎注册,届时观看。

image.png

更多活动参与详情

请访问“ NVIDIA 英伟达网络”公众号

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
8月前
|
机器学习/深度学习 人工智能 芯片
|
8月前
|
人工智能 物联网 云计算
|
存储 人工智能 安全
探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从?
在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。
|
人工智能 搜索推荐 数据中心
|
机器学习/深度学习 人工智能 并行计算
|
存储 机器学习/深度学习 人工智能
|
机器学习/深度学习 人工智能 算法
好产品源于更用芯 华为麒麟810带来全新AI体验
好产品源于更用芯 华为麒麟810带来全新AI体验
239 1
好产品源于更用芯 华为麒麟810带来全新AI体验
|
存储 机器学习/深度学习 人工智能
进军Arm服务器,携手微软开启云超算,这是英伟达黄仁勋的「超算已来」
在刚刚正式开幕的国际超级计算机大会(SC2019)上,英伟达 CEO 黄仁勋宣布了三项重大的产品信息:基于 GPU 加速器的 Arm 服务器、可在微软 Azure 云服务上使用的 GPU 加速型超级计算机 NDv2 以及几分钟即可实现数据移动的 Magnum IO 软件套件。
194 0
进军Arm服务器,携手微软开启云超算,这是英伟达黄仁勋的「超算已来」
英特尔联手Facebook,称将于下半年推出更通用的AI芯片
这一合作将会催生更加通用的AI芯片的诞生。
299 0