阿里基础设施技术亮相SIGCOMM 2018

简介:

8月21日,一场在匈牙利举办的关于未来网络技术走向的SIGCOMM 2018学术顶级会议获得了来自亚洲、北美和欧洲科技界人士密切关注。阿里巴巴在会上首次从多个维度分享了网络技术远景和开创性进展,获得了参会各方的高度认可。

SIGCOMM是网络领域的顶级学术会议

三十多年来世界顶尖的大学和科技公司在SIGCOMM上发表的论文奠定了人们对最先进的网络技术的认知。SIGCOMM对论文的质量要求极高,必须具有基础性贡献、前瞻性影响和坚实的系统实现,每年只录用30篇左右。由于SIGCOMM的论文往往会被广泛引用,并具有极大的影响力,因此能在SIGCOMM上发表论文是所有网络研究人员孜孜以求的荣誉。

这届SIGCOMM,阿里巴巴是唯一拥有技术专家参与论文评审和方向制定的中国公司。

eb5987e24cad353b4a65c4be15d03f888844c883

此外,阿里巴巴还在会议的第一天举办了阿里之夜活动,与来自亚洲、北美和欧洲的知名学府包括麻省理工学院、斯坦福、卡内基梅隆、加州大学伯克利分校、普林斯顿大学在内的大学教授和博士生们分享了阿里面向未来网络技术的愿景和挑战。

美国工程院院士、SIGCOMM终身成就奖得主Jennifer Rexford教授、清华大学长江特聘教授毕军老师、卡内基梅隆大学Justin Sherry教授、康奈尔大学Rachit Agarwal教授参加了活动并做了分享。

b12fec4655fa54ce15ec23d5f54b004c7fbd8582

技术分享回顾

阿里巴巴的网络软硬件技术栈

“在当前网络的规模快速增长,以及上层应用对网络性能、稳定性和成本的要求不断提高的背景下,未来网络技术亟待突破的三大方向包括可编程/定制化硬件(如SmartNIC,programmable ASIC),软硬件一体化的设计(如RDMA,kernel bypassing),以及智能化网络运维(如AIOps,intent-based networking)。”

——阿里巴巴研究员张铭

目前,阿里在这几个关键的方向上,已经系统性的开展了前瞻性的基础研究,并有多项最新研究成果已经或正在阿里现网上落地和规模化部署。

af9839bb41bb2d001091005c0d2a41077b3b8027

阿里巴巴“Hyper-scale Edge Network”愿景

阿里巴巴基础设施首席网络架构师蔡德忠分享了阿里基础网络的整体演进构想,展示了阿里在基础网络方面行业领先的包括RDMA,网络可视化,全球流量调度等前沿研发成果,并首次对外分享了阿里巴巴 “Hyper-scale Edge Network” 的愿景。

“从基础网络的角度看,云计算的第一阶段完成了支持百万级服务器的数据中心网络,接下来云计算会更加靠近用户,向边缘部署以提供更好的用户体验和支持更多的应用场景,比如物联网,支持百万级服务器、分散部署在成千上万个边缘节点的超大规模边缘网络 “Hyper-scale Edge Network” 将是网络要实现的下一个重要场景,关系到云计算在未来的核心竞争力。“Hyper-scale Edge Network” 必须解决三大核心问题包括:高效的自动化运维体系,智能化流量调度和多层次安全防御。”

——阿里巴巴基础设施首席网络架构师蔡德忠

16fd48600759e44e86ce69999746265944e45306

智能化运维中“网络层次化模型”

随着互联网经济的飞速发展,互联网公司的网络规模和复杂度已达到了前所未有的高度,并且还在快速增长。如何高效的管理大规模网络以实现高性能、高稳定和低成本的网络服务,一直以来是网络研究界的一项核心难题。

在今年的SIGCOMM会议上,在由美国工程院院士,普林斯顿大学教授Jennifer Rexford主办的Self-Driving Networks Workshop中,阿里巴巴发表论文《Automatic Life Cycle Management of Network Configurations》,创新性提出了“网络层次化模型”的概念,并且在阿里的全球网络中首次证明了通过这样一个统一的网络模型,可以实现网络配置的整个生命周期(包括配置生成,配置验证,和配置变更)的全自动化,将网络智能化的水平提升到前所未有的高度。

这表明阿里巴巴在网络智能化运维方面已经和Google、亚马逊、Facebook、微软达到了同一高度,并且在网络形式化验证、快速故障恢复等方面开始弯道超车。

RDMA高性能网络

与传统TCP/IP网络不同,RDMA提供的低延迟高带宽能显著提高机器学习、高性能存储、大数据等应用的性能。然而RDMA在高性能的背后也存在着技术复杂性极高的难题。阿里巴巴是极少数能在生产网中大规模部署RDMA的公司之一。在今年SIGCOMM上,阿里巴巴高级技术专家刘洪强博士组织了Kernel Bypassing Networks Workshop以专门探讨RDMA和智能网络硬件技术的最新进展,并请来了Mellanox创始人Eitan Zahavi博士来做主题演讲。Mellanox是RDMA网卡的领军公司之一,阿里巴巴正在与Mellanox 等网卡厂商深度合作开发新一代RDMA硬件和流控算法。

1b0bd7d5c991e6255948b64d93a43fb58ec5d4ea

阿里巴巴高级技术专家、计算机网络领域著名华人学者刘洪强博士主持KBNet Workshop

531bec681b99d7b449394ae1ec32e48365284c80

Mellanox联合创始人,杰出架构师Eitan Zahavi在KBNet做主题演讲

网络可视化

“阿里巴巴是网络可视化技术的先驱。在丰富的业务形态和大规模网络基础设施的驱使下,阿里近年来积极与国际顶级网络硬件厂商合作,推动产业生态和行业标准,主导设计了新一代硬件架构和接口,率先实现了网络可视化的规模化部署,并正在此基础上研究网络架构的智能化设计、网络故障的秒级恢复和下一代数据中心网络流量调度系统,以大幅度提升数据中心网络的带宽利用率和稳定性。”

——阿里巴巴高级网络架构师、数据中心网络知名专家 曹捷

bc205903177f848c8b9f82dd18882a6d59995091

阿里在今年SIGCOMM的Industry Demo Session上展示了最新的网络可视化成果,引起了学术界、互联网公司、以及硬件厂商等的极大共鸣。


原文发布时间为:2018-08-23

本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”。

相关文章
|
3月前
|
自然语言处理 供应链 搜索推荐
2026年电商行业有哪些Agent应用
电商正加速落地AI Agent,从营销、供应链到客服、决策全面升级。瓴羊推出Dataphin(数据治理)、Quick BI小Q(智能分析)、Quick Audience(精准营销)、Quick Service(金牌导购)四大Agent,构建协同智能体矩阵,打通“人货场”全链路,助力企业实现高质量增长。(239字)
|
3月前
|
数据采集 缓存 监控
Python写爬虫太慢?这5个技巧让你的效率提升300%!
Python爬虫效率低?别怪代码!协程(aiohttp)、连接池、智能缓存、BloomFilter去重、库选型五大技巧实测可提效3–10倍,十万数据从“熬一夜”缩短至2小时,轻松应对竞品分析等紧急任务。(239字)
332 2
|
3月前
|
人工智能 数据中心 芯片
告别AI算力圈“局外人”的100词手册
本文系统梳理AI与算力领域的100个核心术语,涵盖基础概念(如LLM、AGI、训练/推理)、硬件架构(GPU/TPU/NPU、HBM、NVLink)、数据中心(集群、液冷、PUE)及网络技术(RoCE、InfiniBand、DPU)四大维度,是入门者快速掌握AI基建语言的实用指南。(239字)
1036 4
|
4月前
|
机器学习/深度学习 Python
浅析线性回归、线性神经网络、Logistic/Softmax回归
线性回归通过最小二乘法或梯度下降等优化线性目标函数,是机器学习基石。其演进催生感知器、逻辑回归与Softmax分类——三者本质均为凸的线性判别模型,统一于“输入加权求和+非线性输出校正”范式。(239字)
261 5
|
存储 算法 C++
Windows共享文件:探秘C++实现的B树索引算法奇境
在数字化时代,Windows共享文件的高效管理至关重要。B树算法以其自平衡多路搜索特性,在文件索引与存储优化中表现出色。本文探讨B树在Windows共享文件中的应用,通过C++实现具体代码,展示其构建文件索引、优化数据存储的能力,提升文件检索效率。B树通过减少磁盘I/O操作,确保查询高效,为企业和个人提供流畅的文件共享体验。
|
算法 数据可视化 量子技术
量子世界的钥匙:量子计算机的编程语言与工具
量子世界的钥匙:量子计算机的编程语言与工具
448 16
|
8月前
|
Java
在Java中避免科学计数法的策略
以上方法都提供了在Java中避免科学计数法的有效途径。选择哪种方法取决于具体的应用场景和需求,如需要的精度、性能考虑以及代码的可读性。在处理大数或精度要求较高的数值时,使用 `BigDecimal` 是一个好的选择。对于一般的数值格式化需求,`DecimalFormat` 或 `String.format()` 方法可能更为方便和高效。
481 19
|
人工智能 小程序 计算机视觉
AI不只有大模型,小模型也蕴含着大生产力
近年来,AI大模型蓬勃发展,从ChatGPT掀起全球热潮,到国内“百模大战”爆发,再到DeepSeek打破算力壁垒,AI技术不断刷新认知。然而,在大模型备受关注的同时,许多小而精的细分模型却被忽视。这些轻量级模型无需依赖强大算力,可运行于手机、手持设备等边缘终端,广泛应用于物体识别、条码扫描、人体骨骼检测等领域。例如,通过人体识别模型衍生出的运动与姿态识别能力,已在AI体育、康复训练、线上赛事等场景中展现出巨大潜力,大幅提升了相关领域的效率与应用范围。本文将带您深入了解这些高效的小模型及其实际价值。
|
机器学习/深度学习 存储 算法
基于MobileNet深度学习网络的活体人脸识别检测算法matlab仿真
本内容主要介绍一种基于MobileNet深度学习网络的活体人脸识别检测技术及MQAM调制类型识别方法。完整程序运行效果无水印,需使用Matlab2022a版本。核心代码包含详细中文注释与操作视频。理论概述中提到,传统人脸识别易受非活体攻击影响,而MobileNet通过轻量化的深度可分离卷积结构,在保证准确性的同时提升检测效率。活体人脸与非活体在纹理和光照上存在显著差异,MobileNet可有效提取人脸高级特征,为无线通信领域提供先进的调制类型识别方案。
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【卷积层】| ICCV-2023 LSK大核选择模块 包含二次独家创新
YOLOv11改进策略【卷积层】| ICCV-2023 LSK大核选择模块 包含二次独家创新
351 0