RDMA

首页 标签 RDMA
# RDMA #
关注
468内容
|
13天前
|
你的GPU正在“等米下锅”:RDMA如何修出一条绕过CPU的高速公路?
本文深度解析现代集群网络的底层革命:从冯·诺依曼瓶颈出发,剖析RDMA如何通过零拷贝、内核旁路与硬件卸载突破TCP/IP桎梏;直击其易用性差、连接爆炸、内存注册昂贵等痛点;并揭示Mooncake(面向LLM KV Cache的张量传输引擎)与Infinistore(万卡级分布式KV底座)如何以内存池化、拓扑感知、RC/UD混合等架构创新, bridging hardware power and software simplicity。
阿里云渠道商:为什么阿里云服务器的网络延迟降低?
阿里云通过RDMA、神龙架构与全球加速网络,实现微秒级延迟和跨境访问提速4倍。覆盖AI训练、实时交互等场景,助力企业高效上云。技术领先,性能卓越,翼龙云提供专业支持与优惠助力。
|
5月前
| |
产品发布:构建高吞吐、低时延、全链路安全的云上数据中心
2025年云栖大会 | 云网络技术分论坛,阿里云智能集团 云网络高级产品技术专家 彭昔敏带来《构建高吞吐、低时延、全链路安全的云上数据中心》的主题演讲,介绍过去1年阿里云网络在构建云上数据中心网络的VPC/NAT/Privatelink等产品的Update
|
6月前
| |
UPN512技术架构白皮书
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
大模型训练推理优化(5): FlexLink —— NVLink 带宽无损提升27%
本期我们将介绍蚂蚁集团ASystem团队在大模型通信优化上的新工作FlexLink,旨在通过动态聚合多路通信(NVLink,PCIe,RDMA),在H800等典型硬件上将典型通信算子如(AllReduce, All Gather)吞吐提升最高达27%,尤其适合大模型长序列推理(Prefill阶段),及训练等通信密集的带宽bound场景。方案对精度无影响。
阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
阿里云PolarDB凭借全球首创基于CXL Switch的分布式内存池技术,在SIGMOD 2025上荣获工业赛道“最佳论文奖”,连续两年蝉联该顶会最高奖项。其创新架构PolarCXLMem打破传统RDMA技术瓶颈,性能提升2.1倍,并已落地应用于内存池化场景,推动大模型推理与多模态存储发展,展现CXL Switch在高速互联中的巨大潜力。
免费试用