近日在ACM SIGCOMM 2019上,阿里云两篇论文被主会收录,阿里巴巴作为唯一中国公司作现场报告。核心研究成果将用于新一代高速云网络,同时实现高速云网络的极致性能和超高稳定性。实践成熟有望替代TCP和RDMA协议的拥塞控制算法,在云数据中心大规模应用。
随着云计算发展,以数据中心为核心的超大规模云网络架构正成为主流,但传统的TCP网络协议难以支持云网络高速、低延迟的要求。RDMA等新一代技术改进了传统TCP的部分弊端,大幅提升网络性能,但仍存在相当高的不稳定性。
阿里巴巴的本次研究成果主要阐述了自研的新一代高速网络拥塞控制协议HPCC(High Precision Congestion Control),兼具性能和稳定。在其帮助下,主流云应用如分布式存储、大规模机器学习等性能将得到几倍到几十倍提升,传输延迟显著降低,更加适用云计算时代的网络需求。
SIGCOMM是计算机网络方向的世界顶级学术会议,对论文质量要求极高,必须满足基础性贡献、前瞻性影响和坚实的系统实现要求,2019大会仅录取了32篇论文。
阿里巴巴始终致力于云计算网络技术的研发,此前已通过对RDMA网络的改造,从网卡底层开始设计,结合自研交换机能力,建成全球最大规模的“RDMA高速网络”。
作为全球前三、亚太第一的云服务商,阿里云在全球19个地域拥有56个可用区,网络总带宽已达到 PB 级别超大规模,目前正在进行400G 网络的研发测试。