4.Cluster

简介: 本文深入解析Dubbo集群容错机制,围绕Cluster核心概念,结合Directory、Router、LoadBalance,详解其如何将多个Invoker伪装为单一入口并实现容错。重点剖析9种Cluster实现类:如Failover(失败重试)、Failfast(快速失败)、Forking(并行调用)、Broadcast(广播调用)等,分别适用于读写场景、通知更新、日志记录等不同业务需求。通过源码逻辑与流程图结合,揭示各策略内部实现机制及适用场景,帮助开发者合理配置容错策略,提升系统稳定性与性能。

我们再来回顾一下官网的对于集群容错的架构设计图
图片加载失败
从标题看就知道本篇主要讲的就是Cluster了,之前我反复强调三个关键词Directory,Router,LoadBalance,但是换个角度而言,其实也可以是四个关键词,还有一个就是Cluster
首先我们先看看官网的介绍,这个Cluster到底是干嘛的
Cluster 将 Directory 中的多个 Invoker 伪装成一个 Invoker,对上层透明,伪装过程包含了容错逻辑,调用失败后,重试另一个
简单来说,就是应对出错情况采取的策略,当然这么说还是有些不准确的.那我们再来看看这个接口及其继承体系图
图片加载失败
看继承体系图中,我们也可以看到了他有9个实现类,换个角度来说,就是有9中应对策略,下面的逐一简介和分析其内部实现(以下逻辑都在Cluster接口的join方法)
MergeableCluster
这个主要用在分组聚合中,我们来看一下官网的介绍
按组合并返回结果 ,比如菜单服务,接口一样,但有多种实现,用group区分,现在消费方需从每种group中调用一次返回结果,合并结果返回,这样就可以实现聚合菜单项。
该类的源码是这么多实现类中最多的.代码全部贴出来篇幅就太大了,我用一个流程图来告诉大家这个类是干什么的
图片加载失败
大家可以根据我这个流程图对照源码理一下思路,这三个判断也是很容易看出来的,比如
URL中merger属性是否有值
是否指定合并方法merger.startsWith("."),为什么是否指定方法是这么判断的呢?因为指定合并方法在xml配置中就是要以"."开头,例如:
是否默认merge策略:
其实这个`ConfigUtils.isDefault从我们使用上都可以推断出他的实现:
AvailableCluster
从单词Available意思就知道,这个是调用可用的.代码实现逻辑也比较简单
图片加载失败
源码的这个写法是比较优雅的,遍历所有的Invokers判断invoker.isAvalible,只要一个有为true直接调用返回,否则就抛出异常。
在2.7.0中升级如下:
ForkingCluster
引用官网的介绍
并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks="2" 来设置最大并行数。
我们来看看源码的实现
图片加载失败
这里就涉及到了线程池,但是由于本篇篇幅会很大,所以线程池的会专门有个专题来讲,可以继续简书关注肥朝
至于这个execute方法是干嘛的,这个时候可以用上码农日常工具推荐里面介绍的Dash
图片加载失败
FailfastCluster
引用官网的介绍
快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。
看看源码实现
图片加载失败
这个的实现应该是实现类里面最简单的,就是调用invoke,调用失败就抛出异常,但是这个却是面试问得最多的,请留意后面的面试题。
MockClusterWrapper
这个主要用在本地伪装上,让我们来看官网描述
本地伪装通常用于服务降级,比如某验权服务,当服务提供方全部挂掉后,客户端不抛出异常,而是通过 Mock 数据返回授权失败
同样我也用一个流程图来描述他的逻辑
图片加载失败
图片加载失败
FailoverCluster
这个是本篇的重点,也是dubbo里面容错方案的缺省值.让我们来看官网介绍
失败自动切换,当出现失败,重试其它服务器。通常用于读操作,但重试会带来更长延迟。可通过 retries="2" 来设置重试次数(不含第一次)
也就是说,默认的情况下,如果第一次调用失败,会重试两次,也就是一共是调用三次.所以len = 3的(经过调试确实是3).
图片加载失败
这个时候面试题就来了,注意我上面提到的FailfastCluster,面试会问:
dubbo中"读接口"和"写接口"有什么区别?答案也是很明显的,因为默认FailoverCluster会重试,如果是"写"类型的接口,如果在网络抖动情况下写入多个值,所以"写"类型的接口要换成FailfastCluster
FailbackCluster
老规矩看官网
失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。
图片加载失败
这个定时重发的逻辑如下,由于还是涉及到线程池,这个必须要有些知识铺垫,后面会讲解,简书关注肥朝即可,不过我们可以先看一下api文档。
图片加载失败
图片加载失败
FailsafeCluster
继续看官网介绍,我反复强调官网介绍,其实也是在回答前面的"怎么看源码"这个问题
失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。
这个的逻辑就很简单了,官网的这句话就已经介绍完了
图片加载失败
BroadcastCluster
老规矩,还是官网介绍
广播调用所有提供者,逐个调用,任意一台报错则报错。通常用于通知所有提供者更新缓存或日志等本地资源信息。
图片加载失败
这个的逻辑也是很简单,遍历所有Invokers, 逐个调用每个调用,有异常就catch,以免影响到剩下的调用,那这个和AvailableCluster有什么区别?当然有啊,你仔细看就知道,BroadcastCluster是要遍历调用完全部的invoker,而AvailableCluster是只要有一个调用就return了.

相关文章
|
3天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
10471 48
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
23天前
|
人工智能 JavaScript Ubuntu
5分钟上手龙虾AI!OpenClaw部署(阿里云+本地)+ 免费多模型配置保姆级教程(MiniMax、Claude、阿里云百炼)
OpenClaw(昵称“龙虾AI”)作为2026年热门的开源个人AI助手,由PSPDFKit创始人Peter Steinberger开发,核心优势在于“真正执行任务”——不仅能聊天互动,还能自动处理邮件、管理日程、订机票、写代码等,且所有数据本地处理,隐私完全可控。它支持接入MiniMax、Claude、GPT等多类大模型,兼容微信、Telegram、飞书等主流聊天工具,搭配100+可扩展技能,成为兼顾实用性与隐私性的AI工具首选。
23655 121
|
9天前
|
人工智能 JavaScript API
解放双手!OpenClaw Agent Browser全攻略(阿里云+本地部署+免费API+网页自动化场景落地)
“让AI聊聊天、写代码不难,难的是让它自己打开网页、填表单、查数据”——2026年,无数OpenClaw用户被这个痛点困扰。参考文章直击核心:当AI只能“纸上谈兵”,无法实际操控浏览器,就永远成不了真正的“数字员工”。而Agent Browser技能的出现,彻底打破了这一壁垒——它给OpenClaw装上“上网的手和眼睛”,让AI能像真人一样打开网页、点击按钮、填写表单、提取数据,24小时不间断完成网页自动化任务。
2240 5