5 本地消息表
ebay搞出来的思想。
5.1 简介
- A系统在本地一个事务里操作的同时,插入一条数据到消息表
- 接着A系统将这个消息发送到MQ
- B系统接收到消息后,在一个事务里,往自己本地消息表里插入一条数据,同时执行其他的业务操作,如果这个消息已经被处理过了,那么此时这个事务会回滚,这样保证不会重复处理消息
- B系统执行成功后,就会更新自己本地消息表的状态以及A系统消息表的状态
- 如果B系统处理失败,那么就不会更新消息表状态,那么此时A系统会定时扫描自己的消息表,如果有未处理的消息,会再次发送到MQ中去,让B再处理
5.2 优点
这个方案保证了最终一致性
哪怕B事务失败了,但是A会不断重发消息,直到B那边成功。
5.3 缺陷
最大的问题就在于严重依赖于数据库的消息表来管理事务,这个会导致高并发场景无力,难以扩展呢,一般确实很少用
- 本地消息表方案
6 可靠消息最终一致性方案
不用本地消息表,直接基于MQ实现事务。比如RocketMQ就支持事务消息。
6.1 执行流程
A系统先发一个prepared消息到MQ,若该prepared消息发送失败,则直接取消操作,不再执行
若该消息发送成功过了,那么接着执行本地事务
1.如果成功就告诉MQ发送确认消息
2.如果失败就告诉MQ回滚消息
如果发送了确认消息,那么此时B系统会接收到确认消息,然后执行本地的事务
MQ会自动定时轮询所有prepared消息回调你的接口,问你这个消息是不是本地事务处理失败了,所有没发送确认的消息,是继续重试还是回滚?
这里你就可以查下数据库看之前本地事务是否执行,如果回滚了,那么这里也回滚吧。这个就是避免可能本地事务执行成功了,别确认消息发送失败了。
如果系统B的事务失败了咋办?
自动不断重试直到成功,若实在不行,要么针对重要业务进行回滚,比如B系统本地回滚后,想办法通知系统A也回滚;要么发送报警由人工来手工回滚和补偿
使用比较广泛,目前国内互联网公司都采用,直接使用RocketMQ支持的最简单。
图解
7 最大努力通知方案
7.1 简介
- 系统A本地事务执行完后,发送一个消息到MQ
- 有一专门消费MQ的最大努力通知服务,会消费MQ,然后写入数据库中记录下来,亦可是放入内存队列,接着调用系统B的接口
- 若系统B执行成功就ok;若系统B执行失败,那么最大努力通知服务就定时尝试重新调用系统B,反复N次,最后还是不行才放弃
- 最大努力通知方案示意图
8 总结
严格资金要求绝对不能错的场景,可考虑TCC来保证强一致性;然后其他的一些场景基于类似阿里的RocketMQ实现分布式事务。
如果是一般的分布式事务场景,订单插入之后要调用库存服务更新库存,库存数据没有资金那么的敏感,可以用可靠消息最终一致性方案。
Rocketmq 3.2.6之前的版本,是可以按照上面的思路来的,但是之后接口做了一些改变,不再赘述
任何一个分布式事务方案,都会导致你那块儿代码复杂10倍。很多情况下,系统A调用系统B、系统C、系统D,我们可能根本就不做分布式事务。如果调用报错会打印异常日志。
每个月也就那么几个bug,很多bug是功能性的,体验性的,真的是涉及到数据层面的一些bug,一个月就几个,两三个?如果你为了确保系统自动保证数据100%不能错,上了几十个分布式事务,代码太复杂;性能太差,系统吞吐量、性能大幅度下跌。
99%的分布式接口调用,不要做分布式事务,直接就是
- 监控(发邮件、发短信)
- 记录日志(一旦出错,完整的日志)
- 事后快速的定位
- 排查和出解决方案
- 修复数据。
每个月,每隔几个月,都会对少量的因为代码bug,导致出错的数据,进行人工的修复数据,自己临时动手写个程序,可能要补一些数据,可能要删除一些数据,可能要修改一些字段的值。
权衡
用分布式事务有性能成本,代码也很复杂,开发很长时间,性能和吞吐量下跌,系统更加复杂更加脆弱反而更加容易出bug;好处,如果做好了,TCC、可靠消息最终一致性方案,一定可以100%保证你那快数据不会出错。
像资金、交易、订单这些业务,我们才可用会使用分布式事务方案来保证,会员积分、优惠券、商品信息,其实就不要这么搞了,严重影响性能!
参考
https://developer.ibm.com/zh/articles/j-lo-jta/