揭秘2017双11背后的网络-双11的网络产品和技术概览

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
EMR Serverless StarRocks,5000CU*H 48000GB*H
网络型负载均衡 NLB,每月750个小时 15LCU
简介: 大家都知道,2017年双11又创造了新纪录,全天交易额1682亿,交易峰值32.5万笔/秒,支付峰值25.6W笔/秒,狂欢的背后是极其复杂庞大的技术系统,其中就有大量阿里云云计算相关的产品和技术,而网络相关产品占据了重要的位置,混合云架构,专有网络VPC,负载均衡SLB,NAT网关,高速通道都是网络产品的典型代表。


引言

大家都知道,2017年双11又创造了新纪录,全天交易额1682亿,交易峰值32.5万笔/秒,支付峰值25.6W笔/秒,狂欢的背后是极其复杂庞大的技术系统,有兴趣的同学可以参考 1682亿背后的技术其中就有大量阿里云云计算相关的产品和技术,而网络相关产品占据了重要的位置,混合云架构,专有网络VPC,负载均衡SLB,NAT网关,高速通道都是网络产品的典型代表。那么,这些网络产品和技术在双11的狂欢中又起了什么作用呢?对大家的购物有什么影响呢?阿里云网络产品团队通过云栖社区的网络产品双11专题系列文章一一为您揭秘


揭秘2017双11背后的网络-一张图读懂2017双11中的网络产品和技术

揭秘2017双11背后的网络-双11的网络产品和技术概览

揭秘2017双11背后的网络-直面双11洪峰的负载均衡SLB

揭秘2017双11背后的网络-全球最大混合云架构


注:如果对网络产品还不太了解的,推荐阅读 一张图看懂阿里云网络产品[一]网络产品概览


下面分别对双11中的主要网络产品-专有网络VPC,负载均衡SLB,NAT网关,高速通道以及混合云架构进行介绍

VPC-安全的网络容器

专有网络VPC (Virtual Private Cloud) 是用户在云上的一个隔离,安全的网络环境,就像 是用户在云上的一个私有的网络容器,这个容器和其它用户逻辑上是彻底隔离的,有了这个网络容器后,就可以在这个容器中“放置”需要的云产品和资源,比如负载均衡SLB,RDS等等。

VPC是用户在云上具备网络管理能力的基础,如选择IP地址范围、划分子网、配置网关、实现多低于私网互通以及和云下IDC的互通等,都需要依赖VPC。有了VPC后,用户就能掌控自己的网络。

公共云平台是很多用户共享的平台,双11电商核心的交易、订单、物流等都是在公共云平台上,为了保证双11交易的安全,使用了专有网络VPC进行租户隔离。

如下图所示,双11使用了公共云平台上的一个VPC,这个VPC和其它VPC都是隔离的,禁止通信的。

e9e6607f5755f527ac7e4dcbaa3ebbc63bc7e736



专有网络VPC使用隧道技术进行逻辑隔离,比经典网络更安全。这么说可能有点抽象,打个比方,VPC使用的隧道技术就好比是在同一条公路上开辟不同的隧道,每个用户有自己独有的隧道,和其它用户的隧道是完全隔离的,而经典网络的安全隔离技术就好比是在同一条公路上有不同的车道,车道之间用隔离带进行隔离,相比而言,没有隧道隔离那么安全。


如下图所示,隧道ID 100和隧道ID 200就对应两个不同用户的VPC,两个VPC中分别有VM1,VM3和VM2,VM4,这2个VPC的VM在各自的隧道上通信,和其它隧道的VM是隔离的。


b0b19c948de4740902da95590c33fd9dfdf92318


大家可能会问,一个VPC容量够不够?能不能存下这么多ECS?这个无需担心,公共云平台上有的用户单个VPC已经超过20000台ECS了,在容器环境下,单VPC也有容纳超5W容器的VPC,可从容应对业务的资源需求。

负载均衡SLB-流量洪峰的调度器

负载均衡SLB产品支持对多台ECS进行流量分发,以提升应用系统的服务能力,长期以来都是关键业务系统的入口。双11亿万用户访问的流量洪峰需要大量的ECS服务器进行处理,而这些ECS的调度都需要依赖负载均衡SLB,负载均衡SLB接收到用户的请求,智能调度到后端的ECS进行处理,并将处理后的结果返回给用户。如下图所示

b652b87c9dc9469f2a65be6bb6f93e926098cb6e


可以说,双11的流量洪峰能不能扛住,用户沟通体验是不是流畅,负载均衡SLB是关键因素。对于负载均衡来说,最关键的是处理能力和调度效率,转换成具体的技术指标有如下:


每秒峰值流量

每秒新建连接数CPS

最大并发连接数MaxConn

每秒查询数QPS

可调度的后端ECS数量


那么,双11负载均衡SLB的表现是怎样的呢,下面是其中一个实例的相关数据


指标项 数据
每秒峰值流量 10G
每秒新建连接数CPS 10W
最大并发连接数MaxConn 300W
后端ECS数量 超过1000台



要说明的是,这仅仅是一个实例的数据,双11中负载均衡SLB使用了很多实例。SLB集群根据规模大小有不同的处理能力,常见的公有云集群单个集群可提供超过1亿的最大连接数,超过1000W的每秒新建连接数,集群总带宽640Gbps。


那么,这些数据的背后,双11的负载均衡实例采用了什么样的配置呢?负载均衡集群又做了哪些优化呢? 推荐阅读 揭秘2017双11背后的网络-直面双11洪峰的负载均衡SLB


NAT网关-支付成功的关键

NAT 网关产品支持SNAT和DNAT功能。SNAT功能即为VPC内无公网ECS提供访问Internet的能力,也支持通过DNAT将公网IP地址映射给VPC ECS,使得VPC ECS可以面向Internet提供服务。


双11中NAT网关主要提供的是SNAT服务,为什么说NAT网关是双11中支付成功的关键呢? 如下图,当用户选择了自己看中的宝贝后,点击“提交订单”



02479628244a23d759dff4240b30bf7bf384392b



即会跳转到支付宝进行付款,这个时候就需要通过NAT网关去调用支付宝的支付接口,这就是NAT网关的SNAT功能,参见如下示意图



644867723ef4ebb4609b1e3484b31b16742fe2ef


双11支付宝交易峰值达到25.6W笔/秒,其中每一笔的支付都需要NAT网关,这就需要NAT网关具备超大规模的带宽和超大并发连接,当然还需要具备超强的容灾能力。整个双11期间,其中一个NAT网关的最大连接数就高达300W。


高速通道-全球最大混合云的网络通道

混合云将公共云和云下数据中心通过专线互通,云上云下连成一体,这就是混合云。混合云既可以保护原有线下IDC的投资,又可以充分利用云的弹性,尤其适合双11这样的促销场景。可以说,双11发展到第九年,其意义早已超越消费和零售领域,更是史无前例的社会化大协同,成为商业、经济、科技变革的最大实验场,因此,双11也是全球最大规模混合云架构的极好实践,在这朵云上,商品浏览,订单支付,客户服务,物流查询等等,很多系统调用频繁在公共云和云下数据中心之间进行,已经成为一个紧密的整体,这些云上云下系统调用的背后都依赖混合云网络通道,这就是高速通道。



如下图所示,高速通道有两个重要的功能,一是专线,即将线下IDC和云上VPC连接起来,二是VPC互联,即将不同的VPC[跨地域]连接起来。



51e085c5b516e8401407e30b2b47d6efdc34b8d6


那么,双11中高速通道支撑下的混合云架构又是怎样的呢?推荐阅读  揭秘2017双11背后的网络-全球最大混合云架构

网络产品背后的系统-洛神

除了网络产品本身,网络更是双11其它任何系统或产品的基础设施,比如双11中的数据库,其处理峰值达到4200万次/秒,就依赖底层的网络技术。又如双11晚会的视频直播,再如说弹性计算ECS的网络性能,更依赖存在于宿主机上的无名英雄-虚拟交换机,等等。可以说 网络是双11背后千百个系统的基础,是基础的基础,核心的核心。那么,双11背后的虚拟网络系统又是怎样的呢? 这里简单介绍下阿里云飞天(Apsara)的虚拟网络系统-洛神,后续将更多的介绍洛神系统。

74a1e4d9d26077454c49cd41ce0e011f66c8313e

洛神分为控制平面,数据平面和运营平面,控制平面主要是利用SDN的思想和技术对网络进行管理和控制,比如开通VPC ECS 就需要通过控制平面进行。数据平面主要是指数据转发,比如EC2 要访问Internet或者其它ECS,再如上文提到的ECS网络性能,就需要依赖数据平面的相关模块。齐天(QITAN)是网络智能分析平台,负责对整个虚拟网络系统进行智能分析,实时监控,并且有智能机器人提供服务。

可以说,网络无处不在,但网络之于双11的最高境界是购物狂欢中感知不到网络的存在,平稳,丝滑的购物体验就是网络的最大意义。



相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11天前
|
存储 云安全 安全
云计算与网络安全:技术挑战与应对策略
【10月更文挑战第6天】 在数字化浪潮下,云计算已成为现代企业不可或缺的技术支柱。然而,随着云服务的快速发展,网络安全问题亦日益凸显。本文将探讨云计算中的安全威胁,并提供针对性的防御措施。从基础的云服务概念出发,文章深入分析了云环境下的安全风险,并结合实际案例,提出了一系列增强云安全的实用建议。读者将通过本文获得对云计算安全领域的全面认识,以及如何实施有效防护的策略。
|
8天前
|
存储 安全 网络安全
云计算与网络安全:技术融合下的挑战与机遇
【10月更文挑战第9天】在数字时代,云计算和网络安全是推动企业创新和保护资产的两大支柱。本文将探讨云计算服务如何影响网络安全策略,并分析信息安全在云环境中的重要性。我们将通过实际案例来揭示云服务带来的安全挑战,同时展示如何利用最新的安全技术来增强防护。文章旨在为读者提供深入的洞见,帮助他们在享受云计算便利的同时,有效规避潜在的安全风险。
21 1
|
3天前
|
移动开发 网络协议 NoSQL
不为人知的网络编程(十七):冰山之下,一次网络请求背后的技术秘密
本文将抛弃千篇一律的计网知识理论,从现实的互联网技术实践角度,一步步为你分享一次网络请求背后的技术秘密。
12 0
|
9天前
|
存储 安全 网络安全
云计算与网络安全:技术挑战与应对策略
【10月更文挑战第8天】随着云计算技术的飞速发展,越来越多的企业和个人开始将数据和应用迁移到云端。然而,这也带来了一系列网络安全问题。本文将探讨云计算环境下的网络安全挑战,并提出相应的应对策略。我们将从云服务模型、网络安全威胁、信息安全技术等方面进行分析,并通过代码示例展示如何实现安全措施。
|
6天前
|
安全 定位技术 数据安全/隐私保护
|
10天前
|
运维 定位技术 网络虚拟化
|
1天前
|
人工智能 关系型数据库 数据中心
2024 OCP全球峰会:阿里云为代表的中国企业,引领全球AI网络合作和技术创新
今年的OCP(Open Compute Project)峰会于2024年10月14日至17日在美国加州圣何塞举行,在这场全球瞩目的盛会上,以阿里云为代表的中国企业,展示了他们在AI网络架构、液冷技术、SRv6和广域网等前沿领域的强大创新能力,持续引领全球合作与技术创新。
|
3天前
|
机器学习/深度学习 编解码 人工智能
技术前沿探索:生成对抗网络(GANs)的革新之路
【10月更文挑战第14天】技术前沿探索:生成对抗网络(GANs)的革新之路
8 2
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
神经网络技术
【10月更文挑战第14天】神经网络技术
|
3天前
|
机器学习/深度学习 编解码 人工智能
技术前沿探索:生成对抗网络(GANs)的革新之路
【10月更文挑战第14天】技术前沿探索:生成对抗网络(GANs)的革新之路
15 1