奠定上层系统稳定安全的基石: 专有云V3网络架构介绍

本文涉及的产品
网络型负载均衡 NLB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介: 网络是奠定上层系统稳定和安全的重要基石。目前专有云版本以V3居多,且V2版本也将于2020年12月31日停止服务和技术支持。本文将对V3版本的专有云网络架构进行介绍。

网络是奠定上层系统稳定和安全的重要基石。目前专有云版本以V3居多,且V2版本也将于2020年12月31日停止服务和技术支持。本文将对V3版本的专有云网络架构进行介绍。

1 V3专有云网络整体架构

image

图1:V3专有云网络架构图

如上图所示,V3专有云网络整体架构的特征如下:

  • V3版本网络架构为两层CLOS,去除PSW层,ASW与DSW直接互连,有效降低网络建设成本。
  • 两层组网(DSW/ASW),ASW和DSW之间跑Layer3。
  • 一组ASW为基础的网络建设单元,全万兆组网。
  • 可根据服务器规模,选择DSW的数量(2/4核心)和设备型号(4/8/16个slot)。

2 设计概要

  • DSW数量为4台,分为两种规格:

(1)18个插槽DSW,每个插槽最大支持36*40G端口密度(同时支持100G端口)。
(2)4个插槽DSW,每个插槽最大支持36*40G端口密度(同时支持100G端口)。

  • 无PSW层设计。
  • ASW两台为一对最小部署单元,进行堆叠后提供跨设备的链路聚合能力。并提供48个万兆接入端口,和440G的上行端口,240G的互连端口。
  • 上联:

(1)8槽DSW每台预留不超过32个40G端口作为上联CSR或者其他设备使用。整个集群最大的外联带宽5.12Tbps。
(2)4槽DSW每台预留不超过16个40G端口作为上联CSR或者其他设备使用。整个集群最大的外联带宽2.56Tbps。

  • 每台ASW上下行带宽收敛比为1:3。
  • ASW与DSW之间运行直连EBGP路由协议,构成underlay的逻辑拓扑。

3 功能模块设计

V3网络架构可划分为综合接入区和业务服务区,综合接入区分为内网接入模块、外网接入模块,业务服务区分为综合接入模块、数据交换模块。

image

图2:V3网络架构功能划分

4 内网接入模块

image

图3:内网接入模块结构图

由一组两台CSW通过专线与客户网络打通,提供用户自有网络接入云上VPC,实现用户自有网络与专有云网络打通,既可以满足用户访问云上VPC,也可以满足用户的普通云服务接入,这也就是我们通常说的“并网”。

CSW做为专有云网络与客户网络的“边界”,在金融领域实际项目中需要接入物理防火墙等安全产品保障网络边界安全性,另外CSW还是用户访问VPC虚拟网络的入口,做为VXLAN接入点,承担着VXLAN隧道的封装和解封装的重任,V1.0网络架构中,一组CSW连接客户专线最大支持160G。

5 外网接入模块

image

图4:外网接入模块结构图

由两台ISW/CSR作为一组外网接入节点,与ISP骨干连接,通过静态路由或EBGP实现云网络内外部路由分发,交互业务服务区通过外网接入模块与公网互通。

需要注意的是ISW与ISP运营商的交互信息,会使用分光器获取到一份in/out双向流量传输给云盾模块(分流器、beaver、guard)。当出现网络攻击时,云盾会给ISW发送明细路由将攻击流量引入云盾服务器清洗,清洗干净的流量通过策略路由回注回ISW。

另外ISW与CSR的区别需要看具体场景,ISW是三层交换机,CSR是路由器,默认情况外网接入模块输出ISW,只有对于有高级三层应用的场景或要求非以太网接口类型时可考虑采用CSR。

6 综合接入模块

image

图5:综合接入模块结构图

负责接入各类网络云产品,例如XGW/SLB/OPS服务器,LSW会与这些服务器跑OSPF动态路由协议,将网络打通,实现NAT转换、SLB负载均衡等重要功能。

7 数据交换模块

image

图6:数据交换模块结构图

数据交换模块是整个IDC网络的核心,由DSW和ASW组成,为所有云业务服务器提供接入,所有云业务服务器间的内部流量交互在本模块内完成,根据网络规模支持DSW2~4台横向扩展。整个数据交换模块内部DSW与ASW之间,以及与各个模块之间均用EBGP互联,通过DSW接收ISW发布的外网路由,发布云产品公网服务地址网段到ISW;ASW交换机两两堆叠,NC网卡bond后双上到一组ASW,且ASW根据需要可选配千兆或者万兆;每张网络会固定一组千兆ASW作为XGW/SLB/OPS带内管控接入。

范少冲

阿里云智能GTS-SRE团队技术服务经理

多年从事IT/云计算领域工作,具有丰富的交付和运维经验,服务过海内外多家500强客户。现就职于阿里云智能GTS-SRE团队,主要负责混合云大客户技术支持,以及网络和安全方面的运维工作。

我们是阿里云智能全球技术服务-SRE团队,我们致力成为一个以技术为基础、面向服务、保障业务系统高可用的工程师团队;提供专业、体系化的SRE服务,帮助广大客户更好地使用云、基于云构建更加稳定可靠的业务系统,提升业务稳定性。我们期望能够分享更多帮助企业客户上云、用好云,让客户云上业务运行更加稳定可靠的技术,您可用钉钉扫描下方二维码,加入阿里云SRE技术学院钉钉圈子,和更多云上人交流关于云平台的那些事。

image

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
8天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
24 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
30天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
261 55
|
1月前
|
监控 安全 API
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
本文详细介绍了PaliGemma2模型的微调流程及其在目标检测任务中的应用。PaliGemma2通过整合SigLIP-So400m视觉编码器与Gemma 2系列语言模型,实现了多模态数据的高效处理。文章涵盖了开发环境构建、数据集预处理、模型初始化与配置、数据加载系统实现、模型微调、推理与评估系统以及性能分析与优化策略等内容。特别强调了计算资源优化、训练过程监控和自动化优化流程的重要性,为机器学习工程师和研究人员提供了系统化的技术方案。
156 77
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
177 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
26天前
|
机器学习/深度学习 算法 数据可视化
基于深度混合架构的智能量化交易系统研究: 融合SSDA与LSTM自编码器的特征提取与决策优化方法
本文探讨了在量化交易中结合时序特征和静态特征的混合建模方法。通过整合堆叠稀疏降噪自编码器(SSDA)和基于LSTM的自编码器(LSTM-AE),构建了一个能够全面捕捉市场动态特性的交易系统。SSDA通过降噪技术提取股票数据的鲁棒表示,LSTM-AE则专注于捕捉市场的时序依赖关系。系统采用A2C算法进行强化学习,通过多维度的奖励计算机制,实现了在可接受的风险水平下最大化收益的目标。实验结果显示,该系统在不同波动特征的股票上表现出差异化的适应能力,特别是在存在明确市场趋势的情况下,决策准确性较高。
65 5
基于深度混合架构的智能量化交易系统研究: 融合SSDA与LSTM自编码器的特征提取与决策优化方法
|
5天前
|
消息中间件 监控 小程序
电竞陪玩系统架构优化设计,陪玩app如何提升系统稳定性,陪玩小程序平台的测试与监控
电竞陪玩系统架构涵盖前端(React/Vue)、后端(Spring Boot/php)、数据库(MySQL/MongoDB)、实时通信(WebSocket)及其他组件(Redis、RabbitMQ、Nginx)。通过模块化设计、微服务架构和云计算技术优化,提升系统性能与可靠性。同时,加强全面测试、实时监控及故障管理,确保系统稳定运行。
|
16天前
|
运维 供应链 安全
阿里云先知安全沙龙(武汉站) - 网络空间安全中的红蓝对抗实践
网络空间安全中的红蓝对抗场景通过模拟真实的攻防演练,帮助国家关键基础设施单位提升安全水平。具体案例包括快递单位、航空公司、一线城市及智能汽车品牌等,在演练中发现潜在攻击路径,有效识别和防范风险,确保系统稳定运行。演练涵盖情报收集、无差别攻击、针对性打击、稳固据点、横向渗透和控制目标等关键步骤,全面提升防护能力。
|
1月前
|
机器学习/深度学习 人工智能 并行计算
【AI系统】Kernel 层架构
推理引擎的Kernel层负责执行底层数学运算,如矩阵乘法、卷积等,直接影响推理速度与效率。它与Runtime层紧密配合,通过算法优化、内存布局调整、汇编优化及调度优化等手段,实现高性能计算。Kernel层针对不同硬件(如CPU、GPU)进行特定优化,支持NEON、AVX、CUDA等技术,确保在多种平台上高效运行。
92 32
|
1月前
|
存储 机器学习/深度学习 人工智能
【AI系统】计算图优化架构
本文介绍了推理引擎转换中的图优化模块,涵盖算子融合、布局转换、算子替换及内存优化等技术,旨在提升模型推理效率。计算图优化技术通过减少计算冗余、提高计算效率和减少内存占用,显著改善模型在资源受限设备上的运行表现。文中详细探讨了离线优化模块面临的挑战及解决方案,包括结构冗余、精度冗余、算法冗余和读写冗余的处理方法。此外,文章还介绍了ONNX Runtime的图优化机制及其在实际应用中的实现,展示了如何通过图优化提高模型推理性能的具体示例。
61 4
【AI系统】计算图优化架构
|
22天前
|
机器学习/深度学习 存储 人工智能
基于AI的实时监控系统:技术架构与挑战分析
AI视频监控系统利用计算机视觉和深度学习技术,实现实时分析与智能识别,显著提升高风险场所如监狱的安全性。系统架构包括数据采集、预处理、行为分析、实时决策及数据存储层,涵盖高分辨率视频传输、图像增强、目标检测、异常行为识别等关键技术。面对算法优化、实时性和系统集成等挑战,通过数据增强、边缘计算和模块化设计等方法解决。未来,AI技术的进步将进一步提高监控系统的智能化水平和应对复杂安全挑战的能力。