RDMA

首页 标签 RDMA
# RDMA #
关注
467内容
构建Tensorflow RDMA的Docker镜像
RDMA是一个远程通讯技术,它通过Kernel bypass等方式降低数据传输中的延迟和CPU消耗。 在分布式训练中,由于多个Worker之间或者Worker和Paramater Server 之间需要大量传输模型变量。当GPU到达一定数量后,受制于网络带宽以及TCP协议的延迟,通讯往往会成为计算性能的瓶颈,而在分布式训练中使用RDMA技术能够非常明显地提高训练速度。 #### Tenso
ESSD云盘助力阿里巴巴集团2018年双11
ESSD云盘是阿里云全新一代超高性能云盘,基于新一代分布式块存储软件架构,结合25GE网络和RDMA技术,提供单盘高达100万的随机读写能力和百微妙级别的时延能力,满足OLTP数据库、NoSQL数据库和Elasticsearch日志分析等应用对性能的极致要求。
InfiniBand 网络
转自David 博客:http://blog.csdn.net/tianlesoftware/article/details/6214232 当前光纤通道和以太网已经能够支持 10Gbps和更高的速率。
免费试用