云企业网CEN2.0产品发布
构建智能全球化云网络
——宋益波
阿里云智能 云网络产品线 高级产品专家
近几年来,随着国家政策的引导和传统企业上云的加速,客户对云上全球化网络的要求越来越高,第一代云企业网已经无法满足客户的诉求。在此背景下,阿里云第二代云企业网 CEN 2.0 应运而生。
近两年,在国家政策的引导下,中国企业数字化转型进程明显加速。国家十四五规划明确强调了推动产业数字化转型,实施“上云用数赋智”行动。
去年 5 月,国家发改委等四部位首次提出了东数西算,将算力服务化,使其能够随时使用,与电一样,用户无须关心电产自哪里、是水电还是煤电、在东部还是西部,可以随时用电。而算力网络从主要连接数据中心算力进化到连接无处不在的、各种各样的算力,从以云为中心变成了以用户为中心。
信通院和清华大学产业研究院的调查表明,传统企业已经成为了中国数字化转型的先锋。而得益于中国传统行业数字化转型的加速,国内云计算的规模也逆势上扬。根据信通院的统计,2020年全球云计算的增速为13%,中国云计算的增速为56%。
传统企业上云和算力网络对全球化网络都提出了更高的要求。
首先,传统企业组网规模更大,连锁企业分支的数量可达到 3000+,网络节点远远超过 CEN 1.0 的上限。而量变产生质变,随着规模增大,网络配置和运维的复杂度进一步增加。比如在全连接的组网模型里,每个节点都要与其他节点建立连接,连接数量是节点数的指数倍。比如两个节点互通只需要配置一次,而 100 个节点需要配置 4950 次,1000个节点就需要 499,500 次。
其次,信通院的数据显示,20%的企业都需要全球化业务组网,这导致网络规模进一步翻倍,而网络规格部署运维的难度进一步增加导致对网络覆盖要求也进一步升级。
最后,根据统计,28%的企业在 IDC 内已经基于物理网络部署了硬件的安全设备。随着企业上云,网络形态变得更为复杂。传统的内网边界已经被打破,如何在云上基于虚拟网络来构建自己的网络安全亦是难点。
我们可以从以下三个方面来应对上述挑战:
① 智能。算力网络的目标是网络无处不达,算力无处不在,智能无所不及。这就需要融合所有网络资源进行统一编排,基于意图引擎为客户提供随时可用的全球化网络。
② 弹性。可以满足客户任意规格、任意地域无缝接入的诉求。
③ 灵活。客户按需取用、按量付费并提供ServiceChain 的能力,可以自定义编排网络。
基于以上思考,阿里重新设计开发了 CEN 2.0,通过CEN 2.0 来构建智能的全球化网络。
CEN 1.0是 2017 年阿里云全球首发的一款产品。目前国内大部分友商都处在产品状态。它提供了网络服务,所有网络节点只要挂载到CEN 即可实现私网的全球互联。相对于原来两两建立连接,它更为方便。但它在规模、灵活性和智能体验上有比较多的局限。
而CEN 2.0 在 1.0 的基础上增加了网元层和智能管理层。
1.全新智能
智能管理层就像大脑,向下统一纳管所有资源,中间进行智能的优化调度。它向上提供 API 接口,通过接口为客户提供全局视角,客户看到的不再是分散的点和线,而是一张整体的网络,网络内可以实现智能组合调度。
网元层提供了 region 级核心路由器,它可以提供丰富的网络功能,极大扩展了组网规模和灵活性。
综上,CEN 2.0首先提供的就是智能组网的能力,让客户更好地构建网络。
随着物联网和边缘计算的发展,我们已经进入到万物互联的时代,大量终端接入到网络中。同时随着全球化的拓展,网络复杂度再次翻倍。CEN 2.0 支持 1000 个节点全自动组网;通过智能编排层,所有路由自动同步;带宽可弹性按量付费。在 10个网络节点的情况下,实现以上几点比较容易,但在上千节点大规模组网的情况下,这就是非常复杂的工程技术。
此外,光实现智能组网还不够,网络变更才是最复杂的,任何变动都可能引起全局的问题。
因此,CEN 2.0 还提供了基于Policy 的意图网络,可以将分散的网络配置变成全局的配置,根据设定的规则自动组网和变更。比如企业同时有生产网和测试网,它们之间互相隔离,但需要共享同数据库。此时,如果使用Policy ,只需设计三个标签,对每个网络节点设置标签后即自动归属到对应的网络中,加入和删除网络节点也不需要网络变更。再加入前端业务时,只需要修改 policy 文件即可。
另外,历史配置文件可以固化保存,一旦发生变更故障,可立即将全局所有网络节点都切换到原有配置,极大降低了网络变更风险。
看似非常简单的两个 ECS 之间互通,底层实则经过了非常多环节,而万物终端上云使其变得更复杂。此前,针对网络不通最常用的方法是发测试包,逐点排查问题,但这种方式效率非常低,而且需要对全链路每个环节都了如指掌。
而CEN 2.0 提供了全链路智能诊断。
比如云上两个 ECS 之间互通。通过全链路诊断,可以看到经过了非常多节点,每个节点有不同的配置。
对路由器里有一条路由的配置注入故障,将这条路由配置删除。
重新进行路径分析,一键即可展现具体故障。
如上图,显示故障为路由不通,且能够自动提示原因为缺少路由配置。
恢复故障,重新添加路由,让路由指向转发路由器。
再重新进行全链路的诊断,可见故障消除,两个ECS 之间恢复了互通,且经过的所有节点都清晰可见。
2.弹性升级
随着业务高速发展,客户对网络规模的要求也越来越高。
① 性能规格。 CEN 2.0 支持1000 个网络节点组网,相比 1.0 提升了 100 倍,领先国内友商 40 倍;同时支持 5000 条路由规模,相比CEN 1.0 提升了 50 倍,领先国内友商 20 倍。
② 网络资源覆盖。在全球覆盖 25 个地域,280 多个点位,在国内和东南亚都处于领先地位。
3.灵活组网
传统企业上云如何基于云上的网络和安全服务来构建网络安全?
比如客户的采购同时服务多个业务线,而采购是公司的机密数据。每个业务线访问的时候都需要经过云防火墙做安全过滤。此前的网络配置非常复杂,因为在全连接的网络中,任意两个节点之间都是直通的。
而 CEN 2.0 实现了四项功能,支持了 ServiceChain能力,分别是多路由表、自定义路由、定义路由的发布和学习。如上图右侧,对于同一个 10 网段的流量,从广告 VPC 发出后,因为关联了路由表,所以会查找路由表 1 的路由发往安全 VPC ;而从安全 VPC 过滤后再发出来关联了路由表2,会查找路由表 2 的路由发往采购 VPC ,则在云上也可以非常灵活地构建服务链网络。
另外,CEN2.0 还独家支持了跨地域QoS 和流日志功能。
在全球组网中,网络质量往往会影响业务的可用性,特别是对网络敏感的业务,比如视频会议、交易同步等。但同时也有一些业务对网络的性能不够敏感,比如离线的数据同步。然而,当发生带宽增强时也会互相影响,过去为了解决此问题,往往需要多买带宽。
而通过QoS 功能,可以优先保证关键业务的性能,同时用其他业务来跑满带宽,最大化带宽利用率。好比公交车道繁忙的时候会优先保证公交车的行驶,而空闲的时候其他车可以复用,提升使用率。
流日志功能可以让客户清晰地看到网络使用情况,且能够上传到自己的SLS 固化保存,方便后续的调查分析或多个部门之间的分账。
组播功能在业界已有广泛的应用,比如多人视频会议、在线培训、证券交易、信息发布等。此前,需要手工搭建,将组播转化成多个单播,不但配置复杂、没有 SLA 保障,还会额外消耗多份带宽。现在我们全新支持云原生主播,无需自建,只需要通过 API 简单配置组播源和组播成员,甚至可直接使用主播协议。能够提供 99.95% 的SLA 保障,并且将带宽的消耗从 N 份降到 1 份(N=组播成员数),大幅节约网络成本。
CEN 2.0 在智能、弹性、灵活方面都有了质的提升,是算力网络在云上的最佳落地实践。未来,我们会持续构建智能的全球化云网络。