负载均衡集群中的session解决方案

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云原生内存数据库 Tair,内存型 2GB
简介:

前言

在我们给Web站点使用负载均衡之后,必须面临的一个重要问题就是Session的处理办法,无论是PHPPythonRuby还是Java,只要使用服务器保存Session,在做负载均衡时都需要考虑Session的问题。


分享目录:

  1. 问题在哪里?如何处理?

  2. 会话保持(案例:Nginx、Haproxy)

  3. 会话复制(案例:Tomcat)

  4. 会话共享(案例:Memcached、Redis)



问题在哪里?

从用户端来解释,就是当一个用户第一次访问被负载均衡代理到后端服务器A并登录后,服务器A上保留了用户的登录信息;当用户再次发送请求时,根据负载均衡策略可能被代理到后端不同的服务器,例如服务器B,由于这台服务器B没有用户的登录信息,所以导致用户需要重新登录。这对用户来说是不可忍受的。所以,在实施负载均衡的时候,我们必须考虑Session的问题。

在负载均衡中,针对Session的处理,我们一般有以下几种方法:

    • Session 保持

    • Session 复制

    • Session 共享


会话保持


Session保持(会话保持)是我们见到最多的名词之一,通过会话保持,负载均衡进行请求分发的时候保证每个客户端固定的访问到后端的同一台应用服务器。会话保持方案在所有的负载均衡都有对应的实现。而且这是在负载均衡这一层就可以解决Session问题。

Nginx 做负载均衡Session保持

对于Nginx可以选用Session保持的方法实行负载均衡,nginxupstream目前支持5种方式的分配方式,其中有两种比较通用的Session解决方法,ip_hashurl_hash。注意:后者不是官方模块,需要额外安装。

ip_hash

每个请求按访问iphash结果分配,这样每个访客固定访问一个后端服务器,达到了Session保持的方法。

例:

1
2
3
4
5
upstream bakend {
    ip_hash;
    server192.168.0.11:80;
    server192.168.0.12:80;
  }

Haproxy做负载均衡的Session保持

    Haproxy作为一个优秀的反向代理和负载均衡软件,也提供了多种Session保持的方法,下面列举了两种最常用的:

源地址 Hash

haroxy 将用户IP经过hash计算后指定到固定的真实服务器上(类似于nginx ip hash 指令)

1
配置指令:balancesource

使用cookie 进行识别 

也就是Haproxy在用户第一次访问的后在用户浏览器插入了一个Cookie,用户下一次访问的时候浏览器就会带上这个CookieHaproxyHaproxy进行识别。

1
配置指令:cookie  SESSION_COOKIE  insert indirect nocache

配置例子如下:

1
2
3
cookie SERVERID insert indirect nocache
server web01 192.168.56.11:8080 check cookie web01
server web02 192.168.56.12:8080 check cookie web02

会话保持的缺点:

会话保持看似解决了Session同步的问题,但是却带来的一些其它方面的问题:

  • 负载不均衡了:由于使用了Session保持,很显然就无法保证负载绝对的均衡。

  • 没有彻底解决问题:如果后端有服务器宕机,那么这台服务器的Session丢失,被分配到这台服务请求的用户还是需要重新登录。



会话复制

既然,我们的目标是所有服务器上都要保持用户的Session,那么将每个应用服务器中的Session信息复制到其它服务器节点上是不是就可以呢?这就是Session的第二中处理办法:会话复制。

 会话复制在Tomcat上得到了支持,它是基于IP组播(multicast)来完成Session的复制,Tomcat的会话复制分为两种:

  • 全局会话复制:利用Delta Manager复制会话中的变更信息到集群中的所有其他节点。

  • 非全局复制:使用Backup Manager进行复制,它会把Session复制给一个指定的备份节点。

    不过,这里我不准备来解释会话复制的Tomcat配置,如果有需求可以参考Tomcat官方文档,主要是因为会话复制不适合大的集群。根据笔者在生产的实践案例,当时是在集群超过6个节点之后就会出现各种问题,不推荐生产使用。


会话共享


既然会话保持和会话复制都不完美,那么我们为什么不把Session放在一个统一的地方呢,这样集群中的所有节点都在一个地方进行Session的存取就可以解决问题。

    Session存放到哪里?

对于Session来说,肯定是频繁使用的,虽然你可以把它存放在数据库中,但是真正生产环境中我更推荐存放在性能更快的分布式KV数据中,例如:MemcachedRedis

 

PHP设置Session共享

如果你使用的是PHP那么恭喜你,配置非常的简单。PHP通过两行配置就可以把Session存放在Memcached或者Redis中,当然你要提前配置好他们。修改php.ini

1
2
session.save_handler = memcache
session.save_path =  "tcp://192.168.56.11:11211"

使用Redis存储Session

1
2
session.save_handler = redis
session.save_path = "tcp://localhost:6379"

提醒:别忘了给PHP安装memcache或者redis插件。

Tomcat设置Session共享

我们可以使用MSMMemcached Session Manager)来实现同样把Session存放到Memcache中,GIthub地址如下:https://github.com/magro/memcached-session-manager目前支持Tomcat 6.x7.x8.x的版本。

如果你想使用Redis,刚好也有开源的可以用,但是遗憾的是暂时不支持Tomcat 8.x的版本:https://github.com/jcoleman/tomcat-redis-session-manager

 

Django设置Session共享

DjangoSession是通过一个中间件管理的。如果要在应用程序中使用Session,需要在settings.py中的MIDDLEWARE_CLASSES变量中加入’django.contrib.sessions.middleware.SessionMiddleware DjangoSession引擎可以将Session存放在三个地方,分别是:数据库、缓存、文件。

使用数据库保存Session

如果你想使用数据库支持的会话,你需要添加'django.contrib.sessions'到你的INSTALLED_APPS设置中。在配置完成之后,请运行manage.py migrate来安装保存会话数据的一张数据库表。

使用缓存保持Session

对于简单的缓存会话:

可以设置SESSION_ENGINE "django.contrib.sessions.backends.cache"。此时会话数据将直接存储在你的缓存中。然而,缓存数据将可能不会持久:如果缓存填满或者缓存服务器重启,缓存数据可能会被清理掉。

  若要持久的缓存数据:

可以设置SESSION_ENGINE"django.contrib.sessions.backends.cached_db"。它的写操作使用缓存,对缓存的每次写入都将再写入到数据库。对于读取的会话,如果数据不在缓存中,则从数据库读取。两种会话的存储都非常快,但是简单的缓存更快,因为它放弃了持久性。大部分情况下,cached_db后端已经足够快,但是如果你需要榨干最后一点的性能,并且接受会话数据丢失的风险,那么你可使用cache而不是cached_db

使用文件保存Session

使用文件保存Session不再我们的讨论之类,因为很难进行共享,PHP默认也是将Session存放在/tmp目录下。



本文转自 a928154159 51CTO博客,原文链接:
http://blog.51cto.com/zhibeiwang/1965018

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
8月前
|
负载均衡 应用服务中间件 Linux
Nginx系列教程(14) - LVS+KeepAlived+Nginx实现高性能负载均衡集群
Nginx系列教程(14) - LVS+KeepAlived+Nginx实现高性能负载均衡集群
456 0
|
18天前
|
消息中间件 负载均衡 算法
【RocketMQ系列十二】RocketMQ集群核心概念之主从复制&生产者负载均衡策略&消费者负载均衡策略
【RocketMQ系列十二】RocketMQ集群核心概念之主从复制&生产者负载均衡策略&消费者负载均衡策略
22 2
|
23天前
|
缓存 负载均衡 NoSQL
Redis系列学习文章分享---第十四篇(Redis多级缓存--封装Http请求+向tomcat发送http请求+根据商品id对tomcat集群负载均衡)
Redis系列学习文章分享---第十四篇(Redis多级缓存--封装Http请求+向tomcat发送http请求+根据商品id对tomcat集群负载均衡)
38 1
|
2月前
|
负载均衡 Kubernetes 网络协议
如何在集群的负载均衡过程保留请求源IP
本文探讨了在Kubernetes (k8s)集群中如何确保服务获取到请求的源IP。通常,源IP可能会因网络地址转换(NAT)和代理服务器而丢失。为保留源IP,文章建议在代理服务器层添加HTTP头`X-REAL-IP`字段。在K8s中,通过设置`externalTrafficPolicy: Local`可保留源IP,但这会牺牲负载均衡。使用Ingress时,可通过配置Ingress Controller的`use-forwarded-headers`并调整ConfigMap来同时保留源IP和实现负载均衡。文章适用于对网络和K8s感兴趣的读者。
76 3
|
1月前
|
负载均衡 运维 监控
负载均衡与容错性:集群模式在分布式系统中的应用
本文由小米分享,解释了分布式系统中的集群模式。集群模式是通过组合多个服务器节点,共同提供服务,实现高可用性、负载均衡和扩展性。文章介绍了主控节点的角色及其高可用性策略,如主备模式和选举机制,并以Zookeeper为例详细阐述了其工作机制。集群模式的优势在于高可用性、负载均衡、扩展性和数据一致性,但也面临节点通信、数据一致性、故障检测和管理等挑战。最后,作者鼓励读者讨论和交流相关技术问题。
238 5
|
2月前
|
负载均衡 监控 网络协议
使用haproxy实现负载均衡集群
【4月更文挑战第14天】HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,快速并且可靠的一种解决方案。
46 1
|
2月前
|
Kubernetes 负载均衡 监控
Kubernetes高可用集群二进制部署(一)主机准备和负载均衡器安装
Kubernetes高可用集群二进制部署(一)主机准备和负载均衡器安装
|
2月前
|
负载均衡 算法 应用服务中间件
面试题:Nginx有哪些负载均衡算法?Nginx位于七层网络结构中的哪一层?
字节跳动面试题:Nginx有哪些负载均衡算法?Nginx位于七层网络结构中的哪一层?
80 0
|
1月前
|
缓存 负载均衡 算法
解读 Nginx:构建高效反向代理和负载均衡的秘密
解读 Nginx:构建高效反向代理和负载均衡的秘密
48 2
|
2月前
|
负载均衡 应用服务中间件 nginx
解决nginx配置负载均衡时invalid host in upstream报错
在Windows环境下,配置Nginx 1.11.5进行负载均衡时遇到问题,服务无法启动。错误日志显示“invalid host in upstream”。检查发现上游服务器列表中,192.168.29.128的主机地址无效。负载均衡配置中,两个服务器地址前误加了"http://"。修正方法是删除上游服务器列表和proxy_pass中的"http://"。问题解决后,Nginx服务应能正常启动。
148 4
解决nginx配置负载均衡时invalid host in upstream报错