阿里基础设施技术亮相SIGCOMM 2018

简介: 阿里巴巴在会上首次从多个维度分享了网络技术远景和开创性进展,获得了参会各方的高度认可。

image.png

8月21日,一场在匈牙利举办的关于未来网络技术走向的SIGCOMM 2018学术顶级会议获得了来自亚洲、北美和欧洲科技界人士密切关注。阿里巴巴在会上首次从多个维度分享了网络技术远景和开创性进展,获得了参会各方的高度认可。

SIGCOMM是网络领域的顶级学术会议

三十多年来世界顶尖的大学和科技公司在SIGCOMM上发表的论文奠定了人们对最先进的网络技术的认知。SIGCOMM对论文的质量要求极高,必须具有基础性贡献、前瞻性影响和坚实的系统实现,每年只录用30篇左右。由于SIGCOMM的论文往往会被广泛引用,并具有极大的影响力,因此能在SIGCOMM上发表论文是所有网络研究人员孜孜以求的荣誉。

这届SIGCOMM,阿里巴巴是唯一拥有技术专家参与论文评审和方向制定的中国公司

image.png

此外,阿里巴巴还在会议的第一天举办了阿里之夜活动,与来自亚洲、北美和欧洲的知名学府包括麻省理工学院、斯坦福、卡内基梅隆、加州大学伯克利分校、普林斯顿大学在内的大学教授和博士生们分享了阿里面向未来网络技术的愿景和挑战。

美国工程院院士、SIGCOMM终身成就奖得主Jennifer Rexford教授、清华大学长江特聘教授毕军老师、卡内基梅隆大学Justin Sherry教授、康奈尔大学Rachit Agarwal教授参加了活动并做了分享。

image.png

技术分享回顾

阿里巴巴的网络软硬件技术栈

“在当前网络的规模快速增长,以及上层应用对网络性能、稳定性和成本的要求不断提高的背景下,未来网络技术亟待突破的三大方向包括可编程/定制化硬件(如SmartNIC,programmable ASIC),软硬件一体化的设计(如RDMA,kernel bypassing),以及智能化网络运维(如AIOps,intent-based networking)。”

——阿里巴巴研究员张铭

目前,阿里在这几个关键的方向上,已经系统性的开展了前瞻性的基础研究,并有多项最新研究成果已经或正在阿里现网上落地和规模化部署。

image.png

阿里巴巴“Hyper-scale Edge Network”愿景

阿里巴巴基础设施首席网络架构师蔡德忠分享了阿里基础网络的整体演进构想,展示了阿里在基础网络方面行业领先的包括网络可视化,全球流量调度等前沿研发成果,并首次对外分享了阿里巴巴 “Hyper-scale Edge Network” 的愿景。

“从基础网络的角度看,云计算的第一阶段完成了支持百万级服务器的数据中心网络,接下来云计算会更加靠近用户,向边缘部署以提供更好的用户体验和支持更多的应用场景,比如物联网,支持百万级服务器、分散部署在成千上万个边缘节点的超大规模边缘网络 “Hyper-scale Edge Network” 将是网络要实现的下一个重要场景,关系到云计算在未来的核心竞争力。“Hyper-scale Edge Network” 必须解决三大核心问题包括:高效的自动化运维体系,智能化流量调度和多层次安全防御。”

——阿里巴巴基础设施首席网络架构师蔡德忠

image.png

智能化运维中“网络层次化模型”

随着互联网经济的飞速发展,互联网公司的网络规模和复杂度已达到了前所未有的高度,并且还在快速增长。如何高效的管理大规模网络以实现高性能、高稳定和低成本的网络服务,一直以来是网络研究界的一项核心难题。

在今年的SIGCOMM会议上,在由美国工程院院士,普林斯顿大学教授Jennifer Rexford主办的Self-Driving Networks Workshop中,阿里巴巴发表论文《Automatic Life Cycle Management of Network Configurations》,创新性提出了“网络层次化模型”的概念,并且在阿里的全球网络中首次证明了通过这样一个统一的网络模型,可以实现网络配置的整个生命周期(包括配置生成,配置验证,和配置变更)的全自动化,将网络智能化的水平提升到前所未有的高度。

这表明阿里巴巴在网络智能化运维方面已经和Google、亚马逊、Facebook、微软达到了同一高度,并且在网络形式化验证、快速故障恢复等方面开始弯道超车。

RDMA高性能网络

与传统TCP/IP网络不同,RDMA提供的低延迟高带宽能显著提高机器学习、高性能存储、大数据等应用的性能。然而RDMA在高性能的背后也存在着技术复杂性极高的难题。阿里巴巴是极少数能在生产网中大规模部署RDMA的公司之一。在今年SIGCOMM上,阿里巴巴高级技术专家刘洪强博士组织了Kernel Bypassing Networks Workshop以专门探讨RDMA和智能网络硬件技术的最新进展,并请来了Mellanox创始人Eitan Zahavi博士来做主题演讲。Mellanox是RDMA网卡的领军公司之一,阿里巴巴正在与Mellanox深度合作开发新一代RDMA硬件和流控算法。

image.png

阿里巴巴高级技术专家、计算机网络领域著名华人学者刘洪强博士主持KBNet Workshop

image.png

Mellanox联合创始人,杰出架构师Eitan Zahavi在KBNet做主题演讲

网络可视化

“阿里巴巴是网络可视化技术的先驱。在丰富的业务形态和大规模网络基础设施的驱使下,阿里近年来积极与国际顶级网络硬件厂商合作,推动产业生态和行业标准,主导设计了新一代硬件架构和接口,率先实现了网络可视化的规模化部署,并正在此基础上研究网络架构的智能化设计、网络故障的秒级恢复和下一代数据中心网络流量调度系统,以大幅度提升数据中心网络的带宽利用率和稳定性。”

——阿里高级网络架构师、数据中心网络专家曹捷

image.png

阿里在今年SIGCOMM的Industry Demo Session上展示了最新的网络可视化成果,引起了学术界、互联网公司、以及硬件厂商等的极大共鸣。

论文资料分享

《Automatic Life Cycle Management of Network Configurations》

《Elastic Sketch: Adaptive and Fast Network-Wide Measurements》

《Network Transparentization in Alibaba》

详情请查询:

https://conferences.sigcomm.org/sigcomm/2018


阿里研究员张铭博士

担任技术委员会委员负责SIGCOMM论文评审,以及主会Network Verification Session主席

阿里高级技术专家刘洪强博士

担任KBNets Workshop的技术委员会主席,负责统筹论文的审定和筛选工作

目录
相关文章
|
Kubernetes 持续交付 开发工具
ACK One GitOps:ApplicationSet UI简化多集群GitOps应用管理
ACK One GitOps新发布了多集群应用控制台,支持管理Argo CD ApplicationSet,提升大规模应用和集群的多集群GitOps应用分发管理体验。
学生0元购|低配也能畅玩!《黑神话:悟空》云电脑攻略
《黑神话:悟空》正式上市,这款备受期待的游戏对电脑配置要求不低,但通过云电脑,你无需担心硬件限制,随时随地畅玩大作。最低仅需1.2元/小时,还能利用学生福利免费畅玩。快速上手教程与省钱攻略,助你轻松征服《黑神话:悟空》!
773 8
学生0元购|低配也能畅玩!《黑神话:悟空》云电脑攻略
|
人工智能 安全 物联网
低代码开发10平台,总有一款适合你
本文介绍的十款低代码开发平台,如Zoho Creator、OutSystems等,各具特色,满足不同业务需求。Zoho Creator提供强大灵活的应用构建能力,支持自动化工作流及跨平台应用;OutSystems强调高效开发与企业级安全性;Mendix擅长快速构建企业级应用,特别是在物联网项目中表现突出;Appian专注业务流程管理,提升工作效率;PowerApps则深度集成微软生态系统,便于构建定制化业务应用;Quick Base适合中小企业快速开发定制应用;
412 3
|
供应链 监控 数据可视化
餐饮业数字化转型:低代码平台的实现策略
**Zoho Creator助力餐饮业数字化转型:**利用低代码平台实现自动化菜单、库存与订单管理,提升效率,增强顾客体验。通过定制应用,轻松跟踪订单、管理顾客信息及财务,确保无缝运营。无论何时何地,都能远程监控餐厅状态。Zoho Creator提供多语言支持、可视化构建、模板库、流程自动化、数据分析及安全保证,降低开发成本,赋能餐饮企业快速适应市场变化。
179 1
|
机器学习/深度学习 数据采集 算法
深入理解并应用机器学习算法:支持向量机(SVM)
【5月更文挑战第13天】支持向量机(SVM)是监督学习中的强分类算法,用于文本分类、图像识别等领域。它寻找超平面最大化间隔,支持向量是离超平面最近的样本点。SVM通过核函数处理非线性数据,软间隔和正则化避免过拟合。应用步骤包括数据预处理、选择核函数、训练模型、评估性能及应用预测。优点是高效、鲁棒和泛化能力强,但对参数敏感、不适合大规模数据集且对缺失数据敏感。理解SVM原理有助于优化实际问题的解决方案。
|
人工智能 机器人 API
Python和阿里云AI服务搭建
使用Python和阿里云AI服务搭建一个简单的聊天机器人的教程 1. 注册阿里云账号并登录。 2. 开通阿里云AI服务,并创建一个智能对话机器人。 3. 获取API密钥和AccessToken。 4. 安装Python环境和SDK。
503 8
|
机器学习/深度学习 人工智能 自然语言处理
【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史
【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史
|
数据可视化 C# 图形学
【Unity 3D】图形界面GUI的讲解及在C#中实现用户登录界面的实战(附源码)
【Unity 3D】图形界面GUI的讲解及在C#中实现用户登录界面的实战(附源码)
463 0
|
网络协议
子网掩码的作用和设置方法
子网掩码是每个网管必须要掌握的基础知识,只有掌握它,才能够真正理解TCP/IP协议的设置。以下我们就来深入浅出地讲解什么是子网掩码。 IP地址的结构 要想理解什么是子网掩码,就不能不了解IP地址的构成。
3650 0
|
存储 运维 Java
基于SpringBoot的社区小型图书管理系统的设计与实现(一)
基于SpringBoot的社区小型图书管理系统的设计与实现
581 0
下一篇
开通oss服务