RDMA

首页 标签 RDMA
# RDMA #
关注
469内容
如何将深度学习训练速度提升一百倍?PAISoar 来了
得力于数据规模增长、神经网络结构的演进和计算能力的增强,深度学习的图像处理、语音识别等领域取得了飞速发展。
系列解读 SMC-R:融合 TCP 与 RDMA 的 SMC-R 通信(二)
通过上一篇文章 《系列解读 SMC-R:透明无感提升云上 TCP 应用网络性能(一)》我们了解到,RDMA 相对于 TCP 具有旁路软件协议栈、卸载网络工作到硬件的特点,能有效增加网络带宽、降低网络时延与 CPU 负载。而内核网络协议 SMC-R 在利用 RDMA 技术的同时、又进一步完美兼容了 socket 接口,能够透明无感的为 TCP 应用带来网络性能提升。因此,龙蜥社区高性能网络 SIG 认为 SMC-R 将成为下一代数据中心内核协议的重要组成,对其进行了大量优化,并积极将这些优化回馈到上游 Linux 社区。
基于阿里云弹性GPU服务的神龙AI加速引擎无缝提升AI训练性能
2023年3月23日14:00(中国时间),NVIDIA GTC开发者大会阿里云开发者社区观看入口正式开放,阿里云高级技术专家林立翔带来了题为《基于阿里云弹性GPU服务的神龙AI加速引擎无缝提升AI训练性能》的分享。
汇量科技使用倚天710云实例 高效处理大流量广告请求
汇量科技为全球移动开发者提供广告技术与营销技术服务,已累计服务全球7000多家互联网企业,其广告推理业务对云实例的CPU性能及内网带宽需求日益提高,通过使用阿里云g8y倚天云实例,实现了性能和网络带宽双双提升。汇量科技顺利承接了大流量广告业务请求,同时,与上一代g6系列对比单机成本更优,综合性价比进一步提升。
阿里云加速AIGC技术公开课重磅上线!主讲大模型的算力挑战、Stable-Diffusion AI绘画与AIGC模型训练
智东西公开课联合阿里云弹性计算团队共同出品「阿里云加速AIGC技术公开课」,阿里云弹性计算产品线异构计算产品专家张新涛、阿里云高级开发工程师吕倪祺、阿里云高级开发工程师于子淇三位技术专家将先后进行直播讲解。
阿里云服务器c8y、g8y、r8y实例性能、指标数据及最新价格分享
继推出轻量应用服务器与通用算力型u1、计算型c7、通用型g7和内存型r7实例云服务器优惠之后,阿里云服务器优惠上新品了,性价比最高的c8y、g8y、r8y云服务器7.2折,购买时长最高可选5年,c8y、g8y、r8y云服务器采用阿里自研倚天710处理器,基于最新一代CIPU和Dragonfly ARM Hypervisor ,通过芯片快速路径加速手段实现计算、存储、网络性能的大幅提升。下面小编来详细介绍下这几款云服务器的实例性能、指标数据及可选配置和优惠价格情况。
技术分享 | 如何利用GPU云服务器加速AIGC训练
阿里云GPU云服务器提供GPU加速计算能力,能够实现GPU计算资源的即开即用和弹性伸缩。同时,配备阿里云自研的弹性RDMA网络,可以实现秒级的大规模RDMA组网,满足大模型计算过程中海量数据的高效传输需求。面向开发者,阿里云还推出了AI计算部署工具FastGPU,使开发者无需关注计算、存储、网络等资源的部署操作,即可达到简单适配、一键部署、随处运行的效果。
结合部属集策略实现更低的eRDMA时延
弹性RDMA(eRDMA)是阿里云ECS提供的RDMA加速功能。为了取得更低的延迟效果,我们可以结合上ECS的部属集策略,使eRDMA尽可能获取到更低的时延。
PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长
阿里云人工智能平台PAI 平台推出模型权重服务,通过分布式缓存架构、RDMA高速传输、智能分片等技术,显著提升大语言模型部署效率,解决模型加载耗时过长的业界难题。实测显示,Qwen3-32B冷启动时间从953秒降至82秒(降幅91.4%),扩容时间缩短98.2%。
免费试用