企业运维训练营之云上网络原理与实践课程 - 第二讲 负载均衡CLB(上)- 产品和架构

简介: 课程目标了解负载均衡CLB的产品功能了解负载均衡CLB的底层架构与相关技术掌握负载均衡CLB的最佳实践熟知负载均衡CLB的常见问题与解决思路

企业运维训练营之云上网络原理与实践课程

第二讲  负载均衡CLB(上)- 产品和架构

 

视频地址:

https://developer.aliyun.com/learning/course/991/detail/14970


课程目标

  • 了解负载均衡CLB的产品功能
  • 了解负载均衡CLB的底层架构与相关技术
  • 掌握负载均衡CLB的最佳实践
  • 熟知负载均衡CLB的常见问题与解决思路

 

课程目录

  • 概述
  • 相关概念与产品功能
  • 产品技术架构
  • 最佳实践
  • 常见问题与解决思路

 

正文:

 

一、概述

 

CLBClassic Load Balancer)通过设置虚拟服务地址,将添加的同一地域的多台ECS实例虚拟成一个高性能和高可用的后端服务池,并根据转发规则,将来自客户端的请求分发给后端服务器池中的ECS实例。

 

CLB默认检查云服务器池中的ECS实例的健康状态,自动隔离异常状态的ECS实例,消除了单台ECS实例的单点故障,提高了应用的整体服务能力。此外,CLB还具备抗DDoS攻击的能力,增强了应用服务的防护能力。

 

1.  为什么需要负载均衡

image.png

CLB架构图

  • 应对高流量的业务访问

大批量用户可以正常同时访问一个接入点,是因为负载均衡器做了一定量的分发;

 

  • 消除单点故障

一台服务器出现故障,其他服务器仍然对外可以提供正常服务,用户使用不受影响;

 

  • 对外提供统一的入口

多个IP地址对外只暴露一个,对外的入口是统一的,运维管理起来比较容易;

 

  • 开箱即用

云产品的特点,即买即用,快速高效;

 

2.  负载均衡行业趋势与挑战

image.png

  • 负载均衡云化趋势明显加速

负载均衡越来越多以云方式部署,云提供商逐渐成为主要玩家,传统硬件厂家加速向云转型,提供基于云化的解决方案;

 

  • 5G/IoT等技术带来机遇与挑战

5G/IoT将加速催生更大流量洪峰,底层通信协议的升级将网络瓶颈转移至应用层面,万物互联使得IPv4加速退出历史舞台,IPv6时代到来;

 

  • 网络环境日益复杂安全性需求凸显

愈加复杂的网络环境、越来越深入的面向应用系统交付,对安全提出了更高要求;

 

  • 云原生:从流量入口到面向应用交付
  • 面向云原生基于7层高级特性加速企业应用快速交付能力,负载均衡从面向网络层演进到面向应用层;
  • 云原生4要素:微服务、容器化、DevOps、持续交付。

 

二、相关概念与产品功能

 

1.  负载均衡产品大图

 image.png

负载均衡产品

 

a.  实例:

 

  • 监听:负载均衡以监听为实例提供服务,如TCP监听、UDP监听、http(s)监听等,然后将请求流量分发至后端服务器;
  • 服务器组:负载均衡是转发模块,并不承载TCP业务,实际的业务通过服务器组和负载均衡产生关联,将服务器组绑定到监听上,如默认服务器组、虚拟服务器组、主备服务器组等,其中虚拟服务器支持转发策略;

 

b.  访问控制ACL

 

可以针对不同的监听,设置访问白名单或黑名单,如某些金融客户只允许特定的IP地址访问;

 

c.  证书管理

 

https证书会对流量进行相应保护,在https监听下,负载均衡会对证书进行托管、加解密转发控制;

 

d.  日志

 

  • 访问日志:相当于NGINXaccess.log,可以通过分析负载均衡的访问日志了解客户端用户行为、客户端用户的地域分布,排查问题等;
  • 健康检查日志:后续将有详细介绍。

 

2.  负载均衡SLB的核心能力:面向超大规模业务的流量入口

 

  • IPv6/IPv4公网入口

 image.png

 

IPv6采用6To4方案,前端对外暴露IPv6地址对外提供V6服务,后端采用V4连接到ECS,轻松实现业务向从V4V6的平滑迁移。

 

  • 最大500万并发连接,应对大流量、大并发场景

image.png

 

丰富的实例规格,支持各种规模的业务场景,弹性计费,应对业务峰值的同时优化成本。

 

三、产品技术架构

 

1.  产品架构

 

阿里云负载均衡CLB产品总体技术架构如下:

 image.png

 

  • AZ容灾高可用架构

双可用区部署,主备容灾实现高可用,业务Always Online

 

  • 海量4层业务处理能力

LVS高性能集群处理4层业务流量应对海量业务洪峰;

 

  • 基于内容的7层业务路由

Tengine集群处理7层业务流量,基于内容的业务路由;

 

  • 高性能HTTPS加解密

硬解密卡实现高效HTTPS流量终结,节省后端服务器算力;

 

2.  全链路流量走向

image.png

 

  • 所有流量都需要经过LVS集群进行转发;
  • LVS集群内的每一台节点服务器均匀地分配海量访问请求;
  • 7层监听会额外经过Tengine集群,HTTPS协议首次请求还会经过Key Server集群;
  • CLB与后端ECSENI通信走内网;

 

3.  健康检查

 image.png

 

健康检查是对CLB集群对后端进行一个探测,多台ECS同时提供一个服务,通过健康检查可以追踪的故障服务,避免了后端ECS异常对总体服务的影响。

 

  • 健康检查可以感知到后端ECS的可用性
  • 探测源均是承载业务的转发集群
  • 探测源IP段为100.64.0.0/10

 

a.  TCP监听

 image.png

 

CLB向后端发起一个TCP三次握手的信报,后端响应完成,以RST方式断开连接。

 

  • 请求方式:TCP三次握手或HTTP GET
  • 判定成功逻辑:超时时间内收到了SYN_ACK
  • 判定失败逻辑:超时时间内未收到SYN_ACK
  • 关闭连接方式:发送RST数据包;

 

问题一:为什么选择RST方式而不是传统的四次挥手断开连接?

因为健康检查是用CLB额外引入的逻辑,对后端ECS具有一定的负担,为了尽可能地减少健康检查的开销,采用了RST方式,只需要单向的一个包就可以立即断开,两端的内核都不再去维护TCP五元组连接的管理。

 

问题二:使用RST可能带来哪些问题?

RSTTCP/IP定义里属于非正常状态,在某些程序比如java程序会频繁提示“connection reset by peer”,只要确定探测源是100.64.0.0/10,就可以认为这是健康检查探测的逻辑,可以忽略该异常信息。

 

b.  UDP监听

 image.png

 

UDP是面向无连接的协议,一般用于如DNSsyslog协议场景,UDP监听的规则是发出报文,在规定时间内,收到回应表示失败,未收到报文表示成功(也可以设置为返回特定字符串来判定成功)。

 

  • 请求方式:UDP报文;
  • 判定成功逻辑:超时时间内没有收到ICMP端口不可达;
  • 判定失败逻辑:超时时间内收到了ICMP端口不可达;

 

c.  HTTP(s)监听

 image.png

 

  • 请求方式:HTTP GET方法或HEAD方法,可能包含Host头,默认使用HEAD方法(尽可能地降低健康检查给后端ECS带来的影响,HEAD方式只返回响应头部字节数,开销也比较小);
  • 判定成功逻辑:超时时间内收到了配置的正常状态码(如200);
  • 判定失败逻辑:除上述以外的情况(如收到了502状态码、收到了RST、建连失败等);

 

d.  滞后性和探测频率

 image.png

 

滞后性:如果机器出现故障时,CLB需要一定的时间才能感应到;

探测频率:探测频率会由于机器数量而倍增,需要在灵敏性和业务可容忍的范围内,适当设定该频率;

 

4.  服务器组

 image.png

 

a.  默认服务器组(某监听上没有配置任何的转发策略,也没关联任何的虚拟服务器组,流量就会转发到此组,一个CLB实例只有一个默认服务器组)

  • 兜底服务器组

 

b.  虚拟服务器组(最灵活,操作成本最低)

  • 转发策略
  • 监听维度

 

c.  主备服务器组(比较灵活,是备用服务机器转发到主服务机器上,不适合常见业务,只适合特定的主备业务)

  • 一主一备
  • 始终对主进行健康检查

 

5.  转发策略

 image.png

CLB转发策略流程图

 

  • 提高单个实例的使用率;
  • 统一管理入口;
  • 灵活调度流量;

 

 

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
相关文章
|
9月前
|
JavaScript
Vue中Axios网络请求封装-企业最常用封装模式
本教程介绍如何安装并配置 Axios 实例,包含请求与响应拦截器,实现自动携带 Token、错误提示及登录状态管理,适用于 Vue 项目。
357 1
|
11月前
|
机器学习/深度学习 存储 监控
内部文件审计:企业文件服务器审计对网络安全提升有哪些帮助?
企业文件服务器审计是保障信息安全、确保合规的关键措施。DataSecurity Plus 是由卓豪ManageEngine推出的审计工具,提供全面的文件访问监控、实时异常告警、用户行为分析及合规报告生成功能,助力企业防范数据泄露风险,满足GDPR、等保等多项合规要求,为企业的稳健发展保驾护航。
329 0
|
供应链 安全 网络协议
|
人工智能 Kubernetes 安全
生成式AI时代,网络安全公司F5如何重构企业防护体系?
生成式AI时代,网络安全公司F5如何重构企业防护体系?
381 9
|
运维 安全 网络性能优化
工业路由器:企业网络的中流砥柱和个人路由器有什么区别?卓伊凡
工业路由器:企业网络的中流砥柱和个人路由器有什么区别?卓伊凡
1102 11
工业路由器:企业网络的中流砥柱和个人路由器有什么区别?卓伊凡
|
安全 架构师 云计算
玄鹿网络 | 中小企业如何借势互联网,打造强势网络品牌?
玄鹿网络在互联网+时代,中小企业面临机遇与挑战,品牌成为企业生存发展的核心灵魂。玄鹿网络通过网络营销助力中小企业塑造品牌形象,其中问答营销可树立良好口碑,B2B网站推广能获取高质量流量,建立企业官网则是展示品牌的窗口。阿里云建站产品如【云·速成美站】和【云·企业官网】,提供快速、稳定、安全的建站服务,助力企业打造独特网络名片,在竞争中脱颖而出。
玄鹿网络 | 中小企业如何借势互联网,打造强势网络品牌?
|
监控 算法 JavaScript
企业用网络监控软件中的 Node.js 深度优先搜索算法剖析
在数字化办公盛行的当下,企业对网络监控的需求呈显著增长态势。企业级网络监控软件作为维护网络安全、提高办公效率的关键工具,其重要性不言而喻。此类软件需要高效处理复杂的网络拓扑结构与海量网络数据,而算法与数据结构则构成了其核心支撑。本文将深入剖析深度优先搜索(DFS)算法在企业级网络监控软件中的应用,并通过 Node.js 代码示例进行详细阐释。
268 2
|
人工智能 运维 监控
领先AI企业经验谈:探究AI分布式推理网络架构实践
当前,AI行业正处于快速发展的关键时期。继DeepSeek大放异彩之后,又一款备受瞩目的AI智能体产品Manus横空出世。Manus具备独立思考、规划和执行复杂任务的能力,其多智能体架构能够自主调用工具。在GAIA基准测试中,Manus的性能超越了OpenAI同层次的大模型,展现出卓越的技术实力。
|
监控 安全 Cloud Native
企业网络架构安全持续增强框架
企业网络架构安全评估与防护体系构建需采用分层防御、动态适应、主动治理的方法。通过系统化的实施框架,涵盖分层安全架构(核心、基础、边界、终端、治理层)和动态安全能力集成(持续监控、自动化响应、自适应防护)。关键步骤包括系统性风险评估、零信任网络重构、纵深防御技术选型及云原生安全集成。最终形成韧性安全架构,实现从被动防御到主动免疫的转变,确保安全投入与业务创新的平衡。
1048 2