TCP接入层的负载均衡、高可用、扩展性架构

简介: web-server如何实施负载均衡?

一、web-server的负载均衡

image.png

互联网架构中,web-server接入一般使用nginx来做反向代理,实施负载均衡。整个架构分三层:

上游调用层,一般是browser或者APP

中间反向代理层,nginx

下游真实接入集群,web-server,常见web-server的有tomcat,apache

整个访问过程为:

browser向daojia.com发起请求

DNS服务器将daojia.com解析为外网IP(1.2.3.4)

browser通过外网IP(1.2.3.4)访问nginx

nginx实施负载均衡策略,常见策略有轮询,随机,IP-hash等

nginx将请求转发给内网IP(192.168.0.1)的web-server

由于http短连接,以及web应用无状态的特性,理论上任何一个http请求落在任意一台web-server都应该得到正常处理(如果必须落在一台,说明架构不合理,不能水平扩展)。

问题来了,tcp是有状态的连接,客户端和服务端一旦建立连接,一个client发起的请求必须落在同一台tcp-server上,此时如何做负载均衡,如何保证水平扩展呢?

二、单机法tcp-server

image.png

单个tcp-server显然是可以保证请求一致性:

client向tcp.daojia.com发起tcp请求

DNS服务器将tcp.daojia.com解析为外网IP(1.2.3.4)

client通过外网IP(1.2.3.4)向tcp-server发起请求

方案的缺点?

无法保证高可用。

三、集群法tcp-server

image.png

通过搭建tcp-server集群来保证高可用,客户端来实现负载均衡:

client内配置有tcp1/tcp2/tcp3.daojia.com三个tcp-server的外网IP

客户端通过“随机”的方式选择tcp-server,假设选择到的是tcp1.daojia.com

通过DNS解析tcp1.daojia.com

通过外网IP连接真实的tcp-server

如何保证高可用呢?

如果client发现某个tcp-server连接不上,则选择另一个。

潜在的缺点?

每次连接前,需要多实施一次DNS访问:

难以预防DNS劫持

多一次DNS访问意味着更长的连接时间,这个不足在手机端更为明显

如何解决DNS的问题?

直接将IP配置在客户端,可以解决上述两个问题,很多公司也就是这么做的(俗称“IP直通车”)。

“IP直通车”有什么新问题?

将IP写死在客户端,在客户端实施负载均衡,扩展性很差:

如果原有IP发生变化,客户端得不到实时通知

如果新增IP,即tcp-sever扩容,客户端也得不到实时通知

如果负载均衡策略变化,需要升级客户端

四、服务端实施负载均衡

只有将复杂的策略下沉到服务端,才能根本上解决扩展性的问题。

image.png

增加一个http接口,将客户端的“IP配置”与“均衡策略”放到服务端是一个不错的方案:

client每次访问tcp-server前,先调用一个新增的get-tcp-ip接口,对于client而言,这个http接口只返回一个tcp-server的IP

这个http接口,实现的是原client的IP均衡策略

拿到tcp-server的IP后,和原来一样向tcp-server发起TCP长连接

这样的话,扩展性问题就解决了:

如果原有IP发生变化,只需要修改get-tcp-ip接口的配置

如果新增IP,也是修改get-tcp-ip接口的配置

如果负载均衡策略变化,需要升级客户端

然而,新的问题又产生了,如果所有IP放在客户端,当有一个IP挂掉的时候,client可以再换一个IP连接,保证可用性,而get-tcp-ip接口只是维护静态的tcp-server集群IP,对于这些IP对应的tcp-server是否可用,是完全不知情的,怎么办呢?

五、tcp-server状态上报

image.png

get-tcp-ip接口怎么知道tcp-server集群中各台服务器是否可用呢,tcp-server主动上报是一个潜在方案,如果某一个tcp-server挂了,则会终止上报,对于停止上报状态的tcp-server,get-tcp-ip接口,将不返回给client相应的tcp-server的外网IP。

该设计的存在的问题?

诚然,状态上报解决了tcp-server高可用的问题,但这个设计犯了一个“反向依赖”的耦合小错误:使得tcp-server要依赖于一个与本身业务无关的web-server。

六、tcp-server状态拉取

image.png

更优的方案是:web-server通过“拉”的方式获取各个tcp-server的状态,而不是tcp-server通过“推”的方式上报自己的状态。

这样的话,每个tcp-server都独立与解耦,只需专注于资深的tcp业务功能即可。

高可用、负载均衡、扩展性等任务由get-tcp-ip的web-server专注来执行。

多说一句,将负载均衡实现在服务端,还有一个好处,可以实现异构tcp-server的负载均衡,以及过载保护:

静态实施:web-server下的多个tcp-server的IP可以配置负载权重,根据tcp-server的机器配置分配负载(nginx也有类似的功能)

动态实施:web-server可以根据“拉”回来的tcp-server的状态,动态分配负载,并在tcp-server性能极具下降时实施过载保护

七、总结

web-server如何实施负载均衡?

利用nginx反向代理来轮询、随机、ip-hash。

tcp-server怎么快速保证请求一致性?

单机。

如何保证高可用?

客户配置多个tcp-server的域名。

如何防止DNS劫持,以及加速?

IP直通车,客户端配置多个tcp-server的IP。

如何保证扩展性?

服务端提供get-tcp-ip接口,向client屏屏蔽负载均衡策略,并实施便捷扩容。

如何保证高可用?

tcp-server“推”状态给get-tcp-ip接口,

or

get-tcp-ip接口“拉”tcp-server状态。

image.png

细节重要,思路比细节更重要

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
目录
相关文章
|
4月前
|
SQL 监控 关系型数据库
MySQL主从复制:构建高可用架构
本文深入解析MySQL主从复制原理与实战配置,涵盖复制架构、监控管理、高可用设计及性能优化,助你构建企业级数据库高可用方案。
|
5月前
|
运维 监控 搜索推荐
MSE ZooKeeper:Flink 高可用架构的企业级选择
本文深入解析了 Apache Flink 架构中 ZooKeeper 的核心作用,包括 Leader 选举、Checkpoint 管理、作业协调及配置管理等关键功能,并结合金融风控与电商推荐等典型场景,分析了 ZooKeeper 在实际应用中的技术实现。
|
8月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
3月前
|
运维 监控 安全
公链开发中的高可用架构设计要点
本指南提供公链高可用架构的可复用流程与模板,涵盖目标拆解、先决条件、分步执行、故障排查及验收标准,结合跨链DApp与量化机器人案例,提升落地效率与系统稳定性。
|
4月前
|
存储 监控 NoSQL
Redis高可用架构全解析:从主从复制到集群方案
Redis高可用确保服务持续稳定,避免单点故障导致数据丢失或业务中断。通过主从复制实现数据冗余,哨兵模式支持自动故障转移,Cluster集群则提供分布式数据分片与水平扩展,三者层层递进,保障读写分离、容灾切换与大规模数据存储,构建高性能、高可靠的Redis架构体系。
|
8月前
|
监控 Linux 应用服务中间件
Linux多节点多硬盘部署MinIO:分布式MinIO集群部署指南搭建高可用架构实践
通过以上步骤,已成功基于已有的 MinIO 服务,扩展为一个 MinIO 集群。该集群具有高可用性和容错性,适合生产环境使用。如果有任何问题,请检查日志或参考MinIO 官方文档。作者联系方式vx:2743642415。
2636 57
|
6月前
|
文字识别 运维 监控
架构解密|一步步打造高可用的 JOCR OCR 识别服务
本文深入解析了JOCR OCR识别服务的高可用架构设计,涵盖从用户上传、智能调度、核心识别到容错监控的完整链路,助力打造高性能、低成本的工业级OCR服务。
268 0
架构解密|一步步打造高可用的 JOCR OCR 识别服务
|
9月前
|
负载均衡 算法 关系型数据库
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL集群架构负载均衡故障排除与解决方案
本文深入探讨 MySQL 集群架构负载均衡的常见故障及排除方法。涵盖请求分配不均、节点无法响应、负载均衡器故障等现象,介绍多种负载均衡算法及故障排除步骤,包括检查负载均衡器状态、调整算法、诊断修复节点故障等。还阐述了预防措施与确保系统稳定性的方法,如定期监控维护、备份恢复策略、团队协作与知识管理等。为确保 MySQL 数据库系统高可用性提供全面指导。
|
3月前
|
Cloud Native Serverless API
微服务架构实战指南:从单体应用到云原生的蜕变之路
🌟蒋星熠Jaxonic,代码为舟的星际旅人。深耕微服务架构,擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验,探索技术演进的无限可能。
微服务架构实战指南:从单体应用到云原生的蜕变之路