RDMA

首页 标签 RDMA
# RDMA #
关注
416内容
|
9月前
|
K8S下一代设备管理机制:DRA
背景Kubernetes从1.8开始引入了Device Plugin机制,用于第三方设备厂商以插件化的方式将设备资源(GPU、RDMA、FPGA、InfiniBand等)接入Kubernetes集群中。用户无需修改Kubernetes代码,只需在集群中以DaemonSet方式部署设备厂商提供的插件,然后在Pod中申明使用该资源的使用量,容器在启动成功后,便可在容器中发现该设备。然而,随着Kuber
技术分享 | 如何利用GPU云服务器加速AIGC训练
阿里云GPU云服务器提供GPU加速计算能力,能够实现GPU计算资源的即开即用和弹性伸缩。同时,配备阿里云自研的弹性RDMA网络,可以实现秒级的大规模RDMA组网,满足大模型计算过程中海量数据的高效传输需求。面向开发者,阿里云还推出了AI计算部署工具FastGPU,使开发者无需关注计算、存储、网络等资源的部署操作,即可达到简单适配、一键部署、随处运行的效果。
|
9月前
|
阿里云入门级企业级云服务器,异构云服务器、弹性裸金属服务器区别参考
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、异构计算、弹性裸金属服务器、超级计算集群可选,根据架构的不同,阿里云服务器的产品类型可分为入门级企业级云服务器,异构云服务器、弹性裸金属服务器等,本文主要简单介绍下不同类型的云服务器有何不同,主要适用场景有哪些。
阿里云于子淇:如何利用GPU云服务器加速AIGC训练|阿里云弹性计算技术公开课直播预告
本节课程,于子淇首先会对AIGC模型的实现原理进行介绍,然后分享阿里云基于弹性RDMA的GPU云服务器的技术特性,以及使用FastGPU在GPU云服务器上进行LLaMA模型部署的流程和finetune原理。最后,于子淇将从计算图优化和通信优化两个方面,讲解基于AIACC的LLaMA模型部署性能优化,并展示优化后的实际效果。 本次课程将在阿里云官网、钉钉视频号、阿里云官方视频号、阿里云创新中心直播平台&视频号、阿里云开发者视频号等多个官方平台同步播出。
|
10月前
|
阿里云计算型实例云服务器收费标准及最新价格参考
计算型实例云服务器是很多用户在购买阿里云服务器时的首选云服务器实例规格,因为计算型实例云服务器的CPU与内存配比大多都是1:2,能够充分利用云服务器的cpu与内存资源,计算型实例云服务器通常适用于Web服务器、广告、游戏等企业通用业务场景。
免费试用