云上网络之5G池化部署调度技术浅谈

本文涉及的产品
应用型负载均衡 ALB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
简介: 5G底层技术架构的革新,为移动通信云化和虚拟化带来了更多可能。近日,AWS和Azure等云服务相继推出云化5G服务模式,5G与云计算技术之间的融合逐渐成为行业趋势。

然而在双方融合与实践中,5G系统厂商或是云计算服务商都需要大量工作修改业务实现,以适配5G系统在云平台更好的运行。此外在云上运行多个5G实例,无论是来自一个还是多个5G系统厂商,都会消耗和浪费大量资源。

为此,阿里达摩院XG实验室联合北京大学计算机学院系统软件团队,对5G系统与底层池化调度技术开展了深入研究分析,初步建立了一套针对5G与云底座的池化调度系统,能够在不修改5G业务代码的前提下快速适配5G网络功能,同时能够提升系统性能、资源与管控效率。为行业提供借鉴意义。


01

5G网络功能适配和资源浪费

image.png

如图,云化5G能够运行在硬件底座上,包括通用硬件(计算、网络、存储)和RAN加速硬件(如ASIC、FPGA、GPU等)。基于硬件底座,阿里提供了云原生底座和达摩院XG实验室5G池化调度系统,从而支撑来自不同5G系统厂商的多个5G移动网络功能(如5G RAN、5G Core等)部署运行。



网络功能适配:在云中运行多个 5G 实例,需要5G网络功能(如基站、核心网等)和云平台之间较好的适配。5G网络功能适配云平台,需要业务代码的修改包括功能设计、编码调试、联调测试、云平台部署、调优迭代等环节,人力和时间成本均较高。


资源浪费:无论是来自同一5G系统厂商还是来自多个5G系统厂商,都会消耗和浪费大量资源,这是当前云平台、5G系统厂商、运营商普遍遇到的问题。例如,一些基准测试显示,基站侧存在约40%~80%的计算资源被浪费。



02

池化调度目标

XG实验室旨在不修改5G系统任何业务代码,从云平台的角度快速统一适配5G系统的网络功能并实现资源优化。这一目标对诸多5G系统厂商是及其友好且便利的,但是这对技术实现带来了很多难题:


5G网络功能多样性适配难度大5G生态中有诸多基站、核心网厂商,不同5G系统厂商的实现虽然存在共性的但是也具备多样性。因此,云平台需要根据5G网络功能的共性进行统一适配,同时兼容多样性,这对云平台的适配工作带来了很大难度。不同5G系统运行在云平台有两种途径:


  1. 5G系统厂商修改5G网络功能业务代码适配云平台;
  2. 5G系统厂商不修改任何业务代码,云平台实现统一适配。

前者对所有5G系统厂商来说需要大量的人力物力和时间成本;而后者主要在于云平台,工作量和难度都极大。


  • 5G网络功能实时性要求高:5G网络功能作为移动通信功能的载体,对实时性、稳定性等指标具有极高的要求。尤其是在基站侧,违反实时性要求可能会导致基站宕机或故障。因此对池化调度技术要求很高,调度不能引入额外的延迟和稳定性影响。


  • 调度指标少:在不修改业务代码的前提下,云平台无法获取5G网络功能内部的调度指标。而宏观指标如CPU资源利用率,因为粒度较粗,在 5G网络功能实时性要求较高的前提下,无法用于细粒度调度。


03

方案:池化调度技术

image.png

如图所示,XG实验室研究团队提出了5G池化调度技术,主要包括监控层和调度器


监控层-无代码入侵适配:监控层实现统一适配工作,使得云平台能够在不改动5G系统厂商业务代码的前提下,支持不同5G系统厂商的多个5G实例部署运行。此外,监控层对不同5G实例的负载进行检测,并将负载波动反馈给调度器。


调度器-微秒级调度:调度器根据来自监控层的5G实例业务负载波动,能够按需对5G实例的线程和CPU资源进行细粒度映射和分配。此外,调度器在用户态实现,极大简化了实现、测试等方面的工作量,云平台能够快速实现并适配不同5G5G系统厂商。


通过实践,使用达摩院XG实验室5G池化调度技术,可以使得云平台满足5G系统厂商部署需求:


1. 无代码入侵适配:无需修改5G系统厂商任何业务代码,阿里云底座池化调度能够快速适配不同5G系统厂商多个5G实例部署运行。云平台适配工作,所需代码开发量较传统实现降低一个数量级。(快速指标的量化)


2. 无性能损失:5G实例端到端时延、吞吐、稳定性等性能指标,CPU cache miss等资源指标,与5G系统厂商原有运行方式相比,性能损失均低于2%


3. 资源优化:支持5G实例与第三方应用弹性扩缩容,CPU资源消耗比原有系统下降35%~88%功耗比原有系统下降10%

相关文章
|
6月前
|
边缘计算 人工智能 5G
5G引领家庭网络升级:速度、稳定性与智能化的新时代
5G引领家庭网络升级:速度、稳定性与智能化的新时代
481 69
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
王耀恒:从网络营销老兵到GEO技术布道者
在王耀恒看来,AI时代的技术竞争已从“信息不对称”转向“系统化应用能力”。他的GEO课程体系正是这一理念的体现——技术可以被复制,但深度实践验证的系统框架、认知升级路径和教学转化艺术却构成了难以逾越的壁垒。
|
6月前
|
人工智能 边缘计算 5G
5G时代,别让能耗成为“隐形杀手”——聊聊5G网络的能耗管理
5G时代,别让能耗成为“隐形杀手”——聊聊5G网络的能耗管理
356 13
|
1月前
|
机器学习/深度学习 人工智能 监控
上海拔俗AI软件定制:让技术真正为你所用,拔俗网络这样做
在上海,企业正通过AI软件定制破解通用化难题。该模式以业务场景为核心,量身打造智能解决方案,涵盖场景化模型开发、模块化架构设计与数据闭环优化三大技术维度,推动技术与业务深度融合,助力企业实现高效、可持续的数字化转型。
|
2月前
|
监控 前端开发 安全
Netty 高性能网络编程框架技术详解与实践指南
本文档全面介绍 Netty 高性能网络编程框架的核心概念、架构设计和实践应用。作为 Java 领域最优秀的 NIO 框架之一,Netty 提供了异步事件驱动的网络应用程序框架,用于快速开发可维护的高性能协议服务器和客户端。本文将深入探讨其 Reactor 模型、ChannelPipeline、编解码器、内存管理等核心机制,帮助开发者构建高性能的网络应用系统。
214 0
|
4月前
|
监控 算法 安全
基于 C# 基数树算法的网络屏幕监控敏感词检测技术研究
随着数字化办公和网络交互迅猛发展,网络屏幕监控成为信息安全的关键。基数树(Trie Tree)凭借高效的字符串处理能力,在敏感词检测中表现出色。结合C#语言,可构建高时效、高准确率的敏感词识别模块,提升网络安全防护能力。
120 2
|
6月前
|
机器学习/深度学习 算法 PyTorch
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
深度学习近年来在多个领域取得了显著进展,但其核心组件——人工神经元和反向传播算法自提出以来鲜有根本性突破。穿孔反向传播(Perforated Backpropagation)技术通过引入“树突”机制,模仿生物神经元的计算能力,实现了对传统神经元的增强。该技术利用基于协方差的损失函数训练树突节点,使其能够识别神经元分类中的异常模式,从而提升整体网络性能。实验表明,该方法不仅可提高模型精度(如BERT模型准确率提升3%-17%),还能实现高效模型压缩(参数减少44%而无性能损失)。这一革新为深度学习的基础构建模块带来了新的可能性,尤其适用于边缘设备和大规模模型优化场景。
291 16
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
|
6月前
|
调度 Python
探索Python高级并发与网络编程技术。
可以看出,Python的高级并发和网络编程极具挑战,却也饱含乐趣。探索这些技术,你将会发现:它们好比是Python世界的海洋,有穿越风暴的波涛,也有寂静深海的奇妙。开始旅途,探索无尽可能吧!
167 15
|
6月前
|
人工智能 运维 算法
AI加持下的网络流量管理:智能调度还是流量黑洞?
AI加持下的网络流量管理:智能调度还是流量黑洞?
243 8