开发者学堂课程【云计算工程师解析与实战-网络专家篇(体验版):阿里云网络总览】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/767/detail/13482
阿里云网络总览
内容介绍:
一、阿里云网络发展历程
二、产品和技术的体系
三、运维及排查
一、阿里云网络发展历程
1.第一代经典网络:包括 IOS ,包括阿里云。
那比如说阿里云 2009 年正式成立,为了迅速的实现为客户提供各种语音服务,阿里云使用经典网络网络:相当于没有 overlay 的网络,是一个平平面型的网络,只有一层。与数据中心使用的网络大同小异。
2.第二代 VPC 网络:需求增加,云上网络和 IDC 打通的需求以及一些云上网络的复杂应用等,催生了这个 vpc 的诞生:
通过 SSL-VPN 、 IPsec-VPN、专线等混合云的连接方式,把云上的资源和 IDC 以及办公室互访的资源做联通。
3.第三代云企业网:全球各个 region 打通、云上云下打通整体架构,实现了全球互联。
在北京、上海、深圳三个区域的 VPN 通过云企业网接入了整个互联,下面杭州、北京、上海的各个分支,办公室分支、门店、软件通过云连接网接上这个云企业网。
阿里云的骨干网页 ABDN : 阿里云租用了互联网专线、运营商专线以保证传输稳定性。以这个全球加速 GA 、这个云企业网 CEN 作为典型的产品。
左边的 VPN 和中间的专线,是一个传统、典型的打通云上云下的方式。
右边是 SD-WAN 的技术,阿里云推出有多种形式的 SAG ,包括硬件版 SAG 、软件版 SAG 、APP 版的 SAG。它可以打通 DC,总部分支移动端等各个设备,通过 SD1 的技术接入到云上。
二、产品和技术的体系。
1.飞天洛神体系
(1)应用生态:飞天洛神是支持阿里的经济体以及阿里云、以及一第三方合作伙伴。
(2)云上网络: VPC 中的产品,包括 sob net 、 eip 等产品。
(3)跨地域网络:即 CEN 、 GA 。
(4)上云网络(混合云网络、企业的万网络):包括 ccn 的云连接网、高速通道。在 ccn 的语音链连接网里面可以用 sag 做打通;高速通道主要是利用专线进行打通。
2.阿里云洛神飞天架构的底层技术经过了两代演进:
(1)洛神 1.0 在转发层面,起初用的是基于 X 86 裸金属的技术,DPDK 技术是用户态的软件技术。
(2)洛神的 2.0 在转发层面,利用软硬一体的各种技术加快转包的速度,提高整体效能;采用了 NFV 的技术以支持高弹性,整体网源管控均基于 NFV 的平台。
三、运维及排查
1.客户角度的云网络运维技术大图。
左边部分是云网络设计的技术站,右边部分是排查和运维的过程中所需要的一些技术站和工具。
(1)物理网络:是整个阿里云的基础设施,包括网络设备、交换机、路由器、安全设备等。
(2)虚拟网络:洛神平台经过 1.0 和 2.0 的发展,最开始是 X86 集群。或者是 OnECS 的架构,现在变成可编程的硬件、软硬一体化等。
(3)网络产品:从这个物理网络到虚拟网络洛神这一部分,是由阿里云来运维的。
(4)协议站、应用程序:由客户的应用里的技术而构成。在协议站部分涉及到主机方面的协议站,包括这个 tcpip 的协议站以及 net filter 内核的框架。
2.专家服务案例排查示例。
在实际的过程中,遇到问题是综合性的问题,而不是单纯某一个产品的问题。
问题的背景:出现了业务抖动(通常是秒级),示例中抖动是 2~3 秒。
基于抖动的特点,本身是较难浮现的。
它的链路(自建的 radius 到整个的数据集的网卡,实际经过的网络模块)是非常长的。
通过层层的定位,包括抓包、阅读源代码,反复排查,最后发现是 nss bug 造成 dentry 缓存泄露,从而导致了关中段的过程中网卡的关注会不会受影响,VM 网卡前端收包不正常导致延迟。这个问题本身是非常复杂的。





