备案控制台

开发者社区问答正文

关于SLB连接重建的问题

目前的想法是想做DB类服务的高可用（如redis）：
原理：前端应用通过SLB VIP访问redis，SLB后端配置一个redis master和若干redis slave，SLB初始配置master权重100，所有slave的权重配置为0（即只有master提供读写服务）
在redis主挂掉后，将某个slave提升为master，此时通过SLB的API将新master的权重调整为100，并将原master的权重调整为0

但是这里存在一个问题：
如果应用使用长连接连接到redis，那么我们调整SLB的访问权重并不会对这些已有的链接造成影响（特别是master短时间内又恢复的场景），即可能导致一部分已有的链接还是连接在原来的master上，更致命的是，此时的SLB的健康检查是OK的（因为此时原master只是无法写入，但是是可以telnet通的），因此应用侧会报无法写入的错误，而SLB还是将请求转发到原master，

目前想到的解决办法就是：
在slave提升为master之后，直接将原master关闭，或者将原master上的所有连接都kill掉，强制让应用侧进行断线重连，但是貌似不够优雅

PS：不要说让我使用阿里云的RDS for redis之类的，目前我们都是自建的，暂时不会使用这个，所以，小伙伴们有什么好的解决方法吗？

展开

收起

redcatmiss 2016-10-27 11:08:57 4305 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

面对您描述的场景，确实存在挑战，尤其是当涉及到长连接和主备切换时。不过，有几个策略可以提高这种自建Redis高可用架构的优雅性和稳定性：

客户端重定向支持：确保您的Redis客户端支持Redis的REPLICAOF命令或者能够理解MOVED/ASK重定向响应。这样，在Redis主节点故障后，新提升的主节点可以通过Redis协议通知客户端新的写入地址，客户端可以根据提示自动重连到新的主节点。这需要客户端逻辑的支持。
代理层实现智能路由：在应用与Redis之间部署一层代理服务（如ProxySQL for MySQL或Twemproxy对于Redis），该代理负责维护当前的主从关系，并根据实时状态智能地将请求路由到正确的Redis实例。当发生主备切换时，代理层可以立即调整路由规则，而无需更改SLB配置或断开现有连接。
利用Redis Sentinel：虽然您提到不直接使用阿里云的托管服务，但Redis自带的Sentinel系统是专为高可用设计的监控和故障转移工具。它能自动发现故障并进行主备切换，同时通过发布订阅模式通知客户端主节点的变化，促使客户端重新连接到新的主节点。这种方式比直接操作SLB权重更自动化且健壮。
改进健康检查机制：如果坚持使用SLB，可以考虑优化SLB的健康检查逻辑，不仅仅检查连接是否可达，还要包括简单的读写测试，确保被转发到的Redis实例是真正可写的。这样，在主节点变为只读状态时，SLB能更快识别并停止向其转发写请求。
Graceful Shutdown & Failover Notification：在手动或通过脚本执行主备切换时，除了调整权重外，还可以尝试在原master上执行一个graceful shutdown过程，比如设置一个标志位，让正在处理的请求完成后再关闭服务，同时通过某种方式（如消息队列、HTTP回调等）通知应用层主节点已变更，应用收到通知后主动断开旧连接并重连。

综上所述，引入中间代理层或利用Redis Sentinel可能是更为优雅和自动化的解决方案，它们能更好地处理主备切换期间的连接管理和通知问题。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

NoSQL 前端开发关系型数据库 API Redis RDS 负载均衡云数据库 Tair（兼容 Redis）

问答标签：

负载均衡连接

问答地址：

开发者社区 > 数据库 > 问答

相关问答

CLB高精度秒计监控中连接失败是什么原因造成的

122

1

0

负载均衡创建连接时间长100ms内无法建立链接

120

1

0

负载均衡访问超过连接请求超时时间会重连吗

115

1

0

负载均衡连接请求超时时间是否可以调整

816

1

0

负载均衡NLB配置每秒最大连接数未生效

121

1

0

容器服务ACK负载均衡配置中提到的“加权最小连接数（WLC）”的功能在负载均衡的配置中为什么找不到？

197

3

0

要配置阿里云ALB Ingress以支持TLS加密的WebSocket连接需要遵循哪个步骤进行配置？

164

0

0

公网类型的ALB，连接VPC中的可用区是否可行？

132

0

0

性能保障型高阶型I slb.s3.small支持多少在线连接？

93

1

0

Nacos有没有最小连接负载均衡策略，目前支持哪几种负载均衡策略？

304

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

相关文章

数据质量不用人盯死：聊聊“规则 + 阈值 + 自愈”怎么玩才靠谱？

Java类加载机制——双亲委派与自定义类加载器

1小时微调 Gemma 3 270M 端侧模型与部署全流程

阿里云邮件推送简单易用、高效稳定的邮件群发服务介绍以及详细收费价格

构建AI智能体：六十九、Bootstrap采样在大模型评估中的应用：从置信区间到模型稳定性

还有其他疑问?