再续前缘 阿里云基础设施网络团队ACM SIGCOMM 2021续创佳绩

简介: SIGCOMM 2021,阿里云网络以三篇论文命中的骄人战绩向世人展示着来自东方的创新风暴,也续写了阿里云基础设施网络团队从2019年开始与SIGCOMM 不间断的“缘分”!

640 (1).gif

本期精彩

  • 连续三年入选国际顶会,彰显了阿里云基础设施网络团队的技术沉淀和强大的研发实力

  • SNA计算平台已在阿里云各个场景规模部署,例如网络可视化、边缘云超融合网关、安全、高性能、以及云网关等。

  • XLINK已集成在手淘完成了大规模测试,测试结果优异,即将开源XLINK的整体架构和协议,将着力与整个业界一同打造多路径QUIC协议,为消费者提供更好的体验。

近日,SIGCOMM 2021论文录取结果公布,阿里云网络以三篇论文命中的骄人战绩向世人展示着来自东方的创新风暴,也续写了阿里云基础设施网络团队从2019年开始与SIGCOMM 不间断的“缘分”!

SIGCOMM,全称Special Interest Group on Data Communication,是目前国际通信网络领域的顶尖会议,也是全球最顶尖科研机构、高校和互联网公司展示自身最先进技术和经验,带领网络技术各个领域向前发展的年度盛会。2019年,阿里云基础设施网络团队在SIGCOMM上实现了主会论文的首次历史性突破,2020年,4篇论文入选震动了网络界,今年又再中三元。连续三年入选国际顶会,也彰显了阿里云基础设施网络团队的技术沉淀和强大的研发实力。

image.png

与一般学术论文不同的是,此次入选的三篇论文不但有创新性想法,更重要的是将理论落地,运用在阿里的具体产品中,为用户带来技术普惠。下面我们将近距离看一下,这三颗阿里网络技术的“明珠”到底凭什么秘诀得到SIGCOMM评委的青睐。

Aquila:阿里云可编程异构计算验证器

可编程交换芯片(programmable switching ASIC)自 2015年问世以来,就受到了全球几乎所有云网络公司及科研学术界的极大关注与欢迎。它可以看做是一种异构计算硬件,其本质是通过对交换机芯片的编程,将原本依赖CPU计算的软件版网络应用“卸载”到交换芯片硬件上,从而获得高达T级的网络数据包处理能力,极大提升网络应用的带宽且降低延迟;同时,由于可编程芯片的灵活可编程性,开发人员可以像软件开发一样灵活地的定制交换芯片的处理逻辑。当前的主流芯片厂商已纷纷推出了各自的可编程芯片,利用可编程芯片来加速基础设施的处理能力已被认为是未来一条重要的技术方向。

然而,在过去几年,虽然学术界同仁发表了大量利用可编程芯片实现各种应用的论文,却从未看到任何云网络公司大规模部署可编程芯片的实例。究其原因,主要由于该技术尚属于较为前沿阶段,虽然其价值被广泛认可,但其部署效率、稳定性等都存在诸多技术挑战和开放性难题,因此令很多科技公司望而却步。

阿里云基础设施网络团队作为可编程网络领域的早期发起者和推动者,多年以来一直致力于在整个可编程网络的应用和生态平台上做出突破性的工作,带动整个产业向前发展。在阿里云诸多工作中,“太玄OS”可编程网络开发、验证、测试和发布平台成为了一个在学术和产业落地双丰收的明星项目(如图1所示)。在SIGCOMM20,太玄OS发表了自己的跨平台编程语言和编译器Lyra(“Lyra: A Cross-Platform Language and Compiler for Data Plane Programming on Heterogeneous ASICs”),阐明了可编程网络领域在编程抽象层面的巨大挑战和揭示了阿里云的解决方案。

image.png
图1|阿里云基础设施网络团队自主研发的“太玄OS”可编程网络异构计算平台

今年,阿里云基础设施网络团队又发表了Lyra的姊妹篇Aquila (“Aquila: A Practically Usable Verification System for Production-Scale Programmable Data Planes ”)来介绍阿里对可编程网络程序正确性保障方面的独树一帜的创新和大规模的落地经验。Aquila的目标是利用形式化验证的方法来发现异构环境下底层程序的bug,以避免系统上线后的稳定性风险。它通过实际的运行和部署经验指出了目前学术界在这个方面的工作的不足,并且通过自主研发的系统解决了如:表达性、可扩展性、可追溯性和验证器自证清白能力等在业界悬而未决的问题。Aquila已经在阿里云ENS/CDN的边缘计算场景中大量使用,为阿里边缘云的稳定性保驾护航。

XGW:阿里云可编程硬件网关

阿里云在可编程网络领域的另一个重要举措就是打造自主可控的以SNA (Smart Networking Appliance) 硬件和AliNOS (Alibaba Network Operating System)软件为基础的软硬件一体化的可编程计算平台和在这个平台上的应用。图2展示了整个阿里自研SNA可编程计算平台的概览。SNA平台的软件层运行阿里自研的网络操作系统AliNOS,硬件层包含了可编程芯片、FPGA、x86以及灵活插口等。SNA作为底层设备,上面由平台能力如:监控、交付/变更、太玄编译/验证,以及测试等保证SNA的运营效率与稳定性。目前,SNA计算平台已在阿里云各个场景规模部署,例如网络可视化、边缘云超融合网关、安全、高性能、以及云网关等。在SIGCOMM20中,阿里云基础设施网络团队发表的“NetSeer:Flow Event Telemetry on Programmable Data Plane”就已经率先揭开了阿里云在可编程网络应用上的冰山一角。

image.png
图2|阿里云基础设施网络团队自主研发的可编程网关软硬件体系

今年阿里云基础设施网络团队和网络产品团队(洛神云网络)共同合作的“Sailfish: Accelerating Cloud-Scale Multi-Tenant Multi-Service Gateways with Programmable Switches”被SIGCOMM21录取,继续着阿里在可编程网络应用方面的领军地位。这个内部代号为XGW (eXtendable GateWay) 的云网关系统是利用SNA这样的平台来替代CPU,提高转发性能的同时减小部署成本的典范。在阿里云网络技术和产品同学的共同努力下,XGW已经实现了超大规模部署,为亿万阿里云用户提供了高性能,高质量的云网络服务。

XLINK:阿里巴巴主导的多路径QUIC方案

除了云网络领域,今年阿里巴巴也在移动网络传输领域发出了“时代最强音”。阿里巴巴在IETF QUIC工作组提出自己的多路径草案并且广受关注之后,由达摩院XG实验室、手淘淘系技术、阿里云基础设施网络团队共同合作研发的XLINK(“XLINK: QoE-Driven Multi-Path QUIC Transport in Large-scale Video Services”)也被SIGCOMM21正式接收。

image.png
图3|XLINK的整体系统架构

QUIC技术是由Google提出, 并于2017年在SIGCOMM会议上发表了QUIC相关论文, 引起了业界的巨大反响, 今年IETF QUIC 1.0标准工作正式完成, 下一代HTTP协议HTTP3正是基于QUIC来实现的。可以说, QUIC是目前移动互联网中最核心和关键的技术, 现如今, 超过50%的Chrome浏览器流量和75%的Facebook流量都在使用QUIC进行传输。 经过过去几年的不懈努力, 阿里巴巴从QUIC技术的追随者快速成长为QUIC技术的创新者, 并在多路径QUIC技术上取得了突破, XLINK相关论文已经被顶级学术会议SIGCOMM 2021正式接收, 这也是SIGCOMM会议历史上第一篇关于多路径QUIC的文章。

XLINK已经集成在手淘完成了大规模测试, 测试结果表明, XLINK在弱网下使用可以实现短视频下载时间降低50%, 首帧加载时间降低32%, 视频卡顿率降低66%, 额外的流量成本降低85%。此外, 在高铁上, XLINK的用户可以同时连接高铁WiFi与手机LTE, 在高速移动的情况下仍然保持流畅的视频观看体验。另外,阿里巴巴也即将开源XLINK的整体架构和协议,将着力与整个业界一同打造多路径QUIC协议,为消费者提供更好的体验。

俗话说“十全十美”,2021年对于阿里网络技术人来说也是一个圆满的一年。从2019开始,截止目前,阿里网络技术已经有10篇SIGCOMM论文被录取。网络领域众多国际专家纷纷被阿里论文“圈粉”,因为不但有创新大胆超前的思维,更重要的是阿里坚持技术创新,把技术与实际应用场景相结合,让技术“走出”实验室,实现“技术普惠”。

除了SIGCOMM,今年阿里云基础设施网也在系统领域顶级会议USENIX ATC发表了论文“Hashing Linearity Enables Relative Path Control in Data Centers”来介绍已经在阿里网络自研交换机部署的交换芯片hash算法特性分析,以及DCMR多路径故障恢复的方法,这也同样是阿里网络技术创新和落地相融合的代言。

相关文章
|
4天前
|
弹性计算 运维 监控
阿里云操作系统控制台解决网络故障
阿里云操作系统控制台是一款功能强大、操作便捷的云服务器管理平台,专为用户提供高效、智能的运维体验。它不仅支持服务器的创建、配置和监控,还集成了智能诊断、自动化运维和资源优化等高级功能,让云服务器管理变得更加轻松高效。通过直观的界面和丰富的工具,用户可以便捷地管理多台云服务器,实时监控系统性能,并快速定位和解决故障。例如,控制台的智能诊断功能能够自动分析系统异常,并提供优化建议,帮助用户迅速恢复服务。除此之外,控制台还支持批量操作、权限管理和日志分析,充分满足企业级用户的需求。无论是个人开发者还是大型企业,都可以借助阿里云操作系统控制台提升运维效率,降低管理成本,确保业务稳定运行。接下来就让我们
40 17
|
8天前
|
缓存 边缘计算 安全
阿里云CDN:全球加速网络的实践创新与价值解析
在数字化浪潮下,用户体验成为企业竞争力的核心。阿里云CDN凭借技术创新与全球化布局,提供高效稳定的加速解决方案。其三层优化体系(智能调度、缓存策略、安全防护)确保低延迟和高命中率,覆盖2800+全球节点,支持电商、教育、游戏等行业,帮助企业节省带宽成本,提升加载速度和安全性。未来,阿里云CDN将继续引领内容分发的行业标准。
52 7
|
9天前
|
弹性计算 运维 负载均衡
课时3:阿里云专有网络VPC:让网络更加独立
阿里云专有网络VPC提供独立、安全的云上网络环境,支持自定义IP地址网段和灵活的路由配置。通过高速通道实现优质网络链路,可用性达99.95%,满足企业高要求的数据传输需求。VPC结合弹性公网IP、负载均衡SLB、Net网关等功能,帮助企业轻松管理网络资源,降低运维成本,实现高效、安全的混合云架构部署。
|
11天前
|
Web App开发 监控 网络协议
网络分析与监控:阿里云拨测方案解密
网络分析与监控:阿里云拨测方案解密
|
3月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
96 17
|
3月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。
|
3月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
67 10
|
3月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
在数字化时代,网络安全和信息安全已成为我们生活中不可或缺的一部分。本文将介绍网络安全漏洞、加密技术和安全意识等方面的内容,并提供一些实用的代码示例。通过阅读本文,您将了解到如何保护自己的网络安全,以及如何提高自己的信息安全意识。
83 10
|
3月前
|
存储 监控 安全
云计算与网络安全:云服务、网络安全、信息安全等技术领域的融合与挑战
本文将探讨云计算与网络安全之间的关系,以及它们在云服务、网络安全和信息安全等技术领域中的融合与挑战。我们将分析云计算的优势和风险,以及如何通过网络安全措施来保护数据和应用程序。我们还将讨论如何确保云服务的可用性和可靠性,以及如何处理网络攻击和数据泄露等问题。最后,我们将提供一些关于如何在云计算环境中实现网络安全的建议和最佳实践。
|
3月前
|
监控 安全 网络安全
网络安全与信息安全:漏洞、加密与意识的交织
在数字时代的浪潮中,网络安全与信息安全成为维护数据完整性、保密性和可用性的关键。本文深入探讨了网络安全中的漏洞概念、加密技术的应用以及提升安全意识的重要性。通过实际案例分析,揭示了网络攻击的常见模式和防御策略,强调了教育和技术并重的安全理念。旨在为读者提供一套全面的网络安全知识框架,从而在日益复杂的网络环境中保护个人和组织的资产安全。

热门文章

最新文章