分布式事务:从理论到实践(二)

本文涉及的产品
云原生内存数据库 Tair,内存型 2GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: AT 模式的一阶段、二阶段提交和回滚均由 Seata 框架自动生成,用户只需编写“业务 SQL”,便能轻松接入分布式事务,AT 模式是一种对业务无任何侵入的分布式事务解决方案。

前文 分布式事务:从理论到实践(一)我们提到了Seata的AT和TCC模式,本文中我们针对这两个模式进行深入分析和开发实践。


AT 模式


原理回顾


根据 官方文档[1] 及提供的 博客[2] 我们先回顾一下AT模式下分布式事务的原理

AT 模式的一阶段、二阶段提交和回滚均由 Seata 框架自动生成,用户只需编写“业务 SQL”,便能轻松接入分布式事务,AT 模式是一种对业务无任何侵入的分布式事务解决方案。


30.jpg


一阶段:在一阶段,Seata 会拦截“业务 SQL”,首先解析 SQL 语义,找到“业务 SQL”要更新的业务数据,在业务数据被更新前,将其保存成“before image”,然后执行“业务 SQL”更新业务数据,在业务数据更新之后,再将其保存成“after image”,最后生成行锁。以上操作全部在一个数据库事务内完成,这样保证了一阶段操作的原子性。


31.jpg


  • 二阶段提交:二阶段如果是提交的话,因为“业务 SQL”在一阶段已经提交至数据库, 所以 Seata 框架只需将一阶段保存的快照数据和行锁删掉,完成数据清理即可。


32.jpg


  • 二阶段回滚:二阶段如果是回滚的话,Seata 就需要回滚一阶段已经执行的“业务 SQL”,还原业务数据。回滚方式便是用“before image”还原业务数据;但在还原前要首先要校验脏写,对比“数据库当前业务数据”和 “after image”,如果两份数据完全一致就说明没有脏写,可以还原业务数据,如果不一致就说明有脏写,出现脏写就需要转人工处理。


33.jpg


环境搭建


本文demo使用的环境是基于

  • SpringBoot
  • Spring Cloud  Alibaba
  • Nacos
  • Apollo
  • docker compose


首先将 seata-server 在服务器搭建起来,由于我们使用 nacos作为seata的注册中心、apollo为注册中心,所以先将这两个组件搭建起来,具体的安装方法请分别参考各自的官方文档。nacos[3]apollo[4]

nacos 和 apollo 搭起来以后,我们开始搭建 seata-server 以下是 docker-compose 的配置:


version: "3.1"
services:
  seata-server:
    image: seataio/seata-server:latest
    hostname: seata-server
    ports:
      - 8091:8091
    environment:
      - SEATA_PORT=8091
      - SEATA_IP={你的IP}
      - SEATA_CONFIG_NAME=file:/seata-server/resources/registry
    volumes:
      - ./seata/registry.conf:/seata-server/resources/registry.conf
    expose:
      - 8091


修改 registry.conf 配置文件,由于我们使用 nacos 作为注册中心,apollo 作为配置中心,所以需要修改到以下配置:


registry {
  # file 、nacos 、eureka、redis、zk、consul、etcd3、sofa
  type = "nacos"
  loadBalance = "RandomLoadBalance"
  loadBalanceVirtualNodes = 10
  nacos {
    application = "seata-server"
    serverAddr = "你的IP:端口"
    group = "SEATA_GROUP"
    namespace = ""
    cluster = "default"
    username = ""
    password = ""
  }
}
config {
  # file、nacos 、apollo、zk、consul、etcd3
  type = "apollo"
  apollo {
    appId = "seata-server"
    apolloMeta = "http://你的IP:端口"
    namespace = "application"
    env= "dev"
    apolloAccesskeySecret = ""
  }
}


注意:seata-server 是可以配置数据库存储 seata 所用数据的,我们为了方便利用本地 file 的方式存储数据,所以没有再做数据库的配置。如需修改可以修改配置文件 file.conf

下面是 file.conf 的默认配置:


store {
  ## store mode: file、db、redis
  mode = "file"
  ## file store property
  file {
    ## store location dir
    dir = "sessionStore"
    # branch session size , if exceeded first try compress lockkey, still exceeded throws exceptions
    maxBranchSessionSize = 16384
    # globe session size , if exceeded throws exceptions
    maxGlobalSessionSize = 512
    # file buffer size , if exceeded allocate new buffer
    fileWriteBufferCacheSize = 16384
    # when recover batch read size
    sessionReloadReadSize = 100
    # async, sync
    flushDiskMode = async
  }
  ## database store property
  db {
    ## the implement of javax.sql.DataSource, such as DruidDataSource(druid)/BasicDataSource(dbcp)/HikariDataSource(hikari) etc.
    datasource = "druid"
    ## mysql/oracle/postgresql/h2/oceanbase etc.
    dbType = "mysql"
    driverClassName = "com.mysql.jdbc.Driver"
    url = "jdbc:mysql://127.0.0.1:3306/seata"
    user = "mysql"
    password = "mysql"
    minConn = 5
    maxConn = 100
    globalTable = "global_table"
    branchTable = "branch_table"
    lockTable = "lock_table"
    queryLimit = 100
    maxWait = 5000
  }
  ## redis store property
  redis {
    host = "127.0.0.1"
    port = "6379"
    password = ""
    database = "0"
    minConn = 1
    maxConn = 10
    maxTotal = 100
    queryLimit = 100
  }
}


启动 nacos、apollo、seata-server


当显示以下信息时,代表seata-server启动了。


35.jpg


这时我们查看 nacos ,也注册上了


34.jpg


apollo 中我们添加一个名为 service.vgroup-mapping.demo-service-seata的key ,value为 default,至于这个的作用,我们后面再说。


36.jpg


我们的 demo 中包含三个服务

  • demo-order
  • demo-storage
  • demo-user


服务间调用使用的是Spring Cloud OpenFeign,除了 SpringBoot 和Spring Cloud 等基础 bom 要依赖外,还需要加入 seata 的依赖,我的pom,大致如下:


<properties>
        <spring-boot-dependencies.version>2.3.2.RELEASE</spring-boot-dependencies.version>
        <spring-cloud-dependencies.version>Hoxton.SR8</spring-cloud-dependencies.version>
        <spring-cloud-alibaba-dependencies.version>2.2.3.RELEASE</spring-cloud-alibaba-dependencies.version>
</properties>
    <dependencyManagement>
        <dependencies>
            <dependency>
                <groupId>org.springframework.boot</groupId>
                <artifactId>spring-boot-starter-parent</artifactId>
                <version>${spring-boot-dependencies.version}</version>
                <type>pom</type>
                <scope>import</scope>
            </dependency>
            <dependency>
                <groupId>org.springframework.cloud</groupId>
                <artifactId>spring-cloud-dependencies</artifactId>
                <version>${spring-cloud-dependencies.version}</version>
                <type>pom</type>
                <scope>import</scope>
            </dependency>
            <dependency>
                <groupId>com.alibaba.cloud</groupId>
                <artifactId>spring-cloud-alibaba-dependencies</artifactId>
                <version>${spring-cloud-alibaba-dependencies.version}</version>
                <type>pom</type>
                <scope>import</scope>
            </dependency>
        </dependencies>
    </dependencyManagement>
    <dependencies>
        <!-- 实现对 Spring MVC 的自动化配置 -->
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
        <!-- 引入 Spring Cloud Alibaba Seata 相关依赖,使用 Seata 实现分布式事务,并实现对其的自动配置 -->
        <dependency>
            <groupId>io.seata</groupId>
            <artifactId>seata-spring-boot-starter</artifactId>
        </dependency>
        <dependency>
            <groupId>com.alibaba.cloud</groupId>
            <artifactId>spring-cloud-starter-alibaba-seata</artifactId>
        </dependency>
        <!-- 引入 Spring Cloud Alibaba Nacos Discovery 相关依赖,将 Nacos 作为注册中心,并实现对其的自动配置 -->
        <dependency>
            <groupId>com.alibaba.cloud</groupId>
            <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
        </dependency>
        <!-- 引入 Spring Cloud OpenFeign 相关依赖,使用 OpenFeign 提供声明式调用,并实现对其的自动配置 -->
        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-openfeign</artifactId>
        </dependency>
    </dependencies>


至于项目中所用ORM框架,数据库连接池等就因人而异了,我用的是mybatis-plus和hikari,数据库用的是 mysql5.7。


针对上面的三个服务分别创建三个数据库,order、user、storage,并在每个库中分别创建一个业务表 t_order、t_user、t_storage 这里就不贴建库表的脚本了,大家可以按照自己的设计自己建,需要注意的是每个库都需要再创建一个 undo_log 表,这是为seata做分布式事务回滚所用。


CREATE TABLE `undo_log` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `branch_id` bigint(20) NOT NULL,
  `xid` varchar(100) NOT NULL,
  `context` varchar(128) NOT NULL,
  `rollback_info` longblob NOT NULL,
  `log_status` int(11) NOT NULL,
  `log_created` datetime NOT NULL,
  `log_modified` datetime NOT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `ux_undo_log` (`xid`,`branch_id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;


每个服务中 application.yml 中对应 seata 的配置如下


spring:
  profiles:
    active: dev
  cloud:
    nacos:
      discovery:
        namespace: public
        password: nacos
        server-addr: IP:PORT
        networkInterface: eth1
        username: nacos
# Seata 配置项,对应 SeataProperties 类
seata:
  application-id: ${spring.application.name} # Seata 应用编号,默认为 ${spring.application.name}
  tx-service-group: demo-service-seata # Seata 事务组编号,用于 TC 集群名
  # Seata 服务配置项,对应 ServiceProperties 类
  service:
    # 虚拟组和分组的映射
    vgroup-mapping:
      demo-service-seata: default
  # Seata 注册中心配置项,对应 RegistryProperties 类
  registry:
    type: nacos # 注册中心类型,默认为 file
    nacos:
      cluster: default # 使用的 Seata 分组
      namespace: # Nacos 命名空间
      serverAddr: 你的IP:端口 # Nacos 服务地址


这里有几点需要注意:

  • demo-service-seata 出现了两次,这两个地方要写成一样
  • demo-service-seata: default
  • 与我们在 apollo 中配置的要一样
  • 与 seata-server registry.conf 中 nacos 的 cluster 配置一样。
  • nacos 配置 networkInterface: eth1
  • 这样写是因为服务部署在服务器后用的内网IP注册到了nacos,想配置它用外网地址就改了下走特定网卡。
  • 解决方案参考:这里[5]例如,使用了Spring cloud alibaba(官方文档)作为Nacos客户端,服务默认获取了内网IP 192.168.1.21,可以通过配置 spring.cloud.inetutils.preferred-networks=10.34.12,使服务获取内网中前缀为10.34.12的IP
  • 在老版本的 seata 是需要手动设置 DataSourceProxy的 ,参考 官网文档[6] 新版本的默认是自动代理的,不需要再写了。


38.jpg


至此我们的环境搭建和准备工作就结束了。


分布式事务具体代码


我们设计这样一个同步的业务流程,创建订单前先扣减库存,再扣减账户余额,然后再创建订单,demo设计上参考了 芋道源码[7]。大致流程如下图:


39.jpg


40.jpg


通过入口进入orderServicer后,进行上面的三步流程,分别调用两个微服务,再调自己的订单服务,这里注意两点:

  • 分布式全局事务入口,要添加 @GlobalTransactional
  • 要抛出异常


接下来是扣减库存微服务部分,简单做了下扣减,小于10抛出异常


41.jpg


然后是账户微服务部分


42.jpg


最后是订单


45.jpg


代码都比较简单,有几个点需要注意下


  • 全局事务的隔离性和本地事务的不是一个概念。
  • 全局事务的隔离级别一定基础上依赖本地事务的隔离级别。因此本地事务的隔离级别只要大于等于seata支持的隔离级别就行,所以一般数据库的默认级别就可以
  • seata的全局事务注解是@GlobalTransactional,@Transactional 是spring的注解,解决本地事务问题,属于两种不同粒度的事务范畴。
  • 如果要加全局事务就一定要用 @GlobalTransactional。
  • 在一个事务方法上,是可以叠加两个注解的,仅意味着功能的叠加,即:有本地事务的处理,也有全局事务的加持。两者不冲突。


由于在数据库本地事务隔离级别 读已提交(Read Committed) 或以上的基础上,Seata(AT 模式)的默认全局隔离级别是 读未提交(Read Uncommitted)


所以这种隔离性会带来问题(注意这里说的是全局事务):


  • 脏读:一个事务读取到另一个事务未提交的数据 解决方案:
  • @GlobalLock+@Transactional 注解 + select语句加for update 或
  • GlobalTransactional注解+select语句加for update
  • 脏写:一个事务提交的数据覆盖了另一个事务未提交的数据 解决方案:必须使用@GlobalTransaction


其实上面这部分,官方文档也写的很清楚,尤其对于隔离性的解析:


47.jpg


上图有些地方理解起来要注意:

  • 这里说的事务指的是全局的分布式事务,别想成本地事务了,
  • 关于@GlobalLock,场景是一个是全局分布式事务,另一个不是分布式事务,如果你想让分布式事务不产生“脏读”,那么可以在另一个非分布式事务上加@GlobalLock。


我的测试中事务的正常执行和回滚都没有问题,如果你观察各数据库的 undo_log 表,可能会发现没有数据,但实际情况是数据是插入后又很快清除了,所以你没看到,如果你观察主键的 auto_increment 可以看到一直在增长。由于我用了阿里云的RDS,可以通过SQL洞察看到SQL的执行历史,这里看到sql确实执行过。


48.jpg


XID是全局事务ID,有时候我们需要获得并进行一些操作,那么可以这样做


String xid = RootContext.getXID();
RootContext.unbind();//解绑
//中途做一些与事务无关的事。比如日志服务等等 排除掉,然后
RootContext.bind(xid);//再绑回来


@GlobalTransactional也有自己的隔离级别和rollback等,可根据业务情况自行设置


package io.seata.spring.annotation;
import io.seata.tm.api.transaction.Propagation;
import java.lang.annotation.ElementType;
import java.lang.annotation.Inherited;
import java.lang.annotation.Retention;
import java.lang.annotation.RetentionPolicy;
import java.lang.annotation.Target;
@Retention(RetentionPolicy.RUNTIME)
@Target({ElementType.METHOD, ElementType.TYPE})
@Inherited
public @interface GlobalTransactional {
    int timeoutMills() default 60000;
    String name() default "";
    Class<? extends Throwable>[] rollbackFor() default {};
    String[] rollbackForClassName() default {};
    Class<? extends Throwable>[] noRollbackFor() default {};
    String[] noRollbackForClassName() default {};
    Propagation propagation() default Propagation.REQUIRED;
}


AT 总结


  • 再次强调AT模式是自动的,它自动帮你做回滚和提交,使用时考虑跟自己的实际业务场景是否适合
  • 例子中我对执行事务的方法并没有做幂等,在实际生产情况下,一定会出现问题的,所以大家在用的时候要注意做接口幂等处理
  • 有关更多seata的参数配置,如超时,重试次数等。请参考 官网[8]这里当然要结合你的feign的重试和超时时间整体考虑。
  • 通过上文的描述我们利用一个例子将AT模式的全局分布式事务模拟了出来,也总结了一些比较难理解和需要注意的点,希望能够帮助到正在使用seata的小伙伴。
相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
1月前
|
NoSQL 关系型数据库 MySQL
分布式锁:不同实现方式实践测评
分布式锁:不同实现方式实践测评
34 0
|
1月前
|
负载均衡 监控 Dubbo
Java微服务架构设计与实践:构建可伸缩的分布式系统
【4月更文挑战第2天】微服务架构响应现代业务需求,通过拆分大型应用为独立服务实现模块化和可扩展性。Java中的Spring Boot和Dubbo等框架支持服务注册、负载均衡等功能。遵循单一职责、自治性和面向接口原则,每个服务专注特定逻辑,独立部署运行。实际项目中,如电商系统,服务按功能拆分,提升可维护性和扩展性。还需考虑服务通信、数据一致性和监控等复杂话题。Java微服务架构助力构建高效、灵活的应用,应对未来挑战。
Java微服务架构设计与实践:构建可伸缩的分布式系统
|
18天前
|
分布式计算 负载均衡 并行计算
Python 分布式计算框架 PP (Parallel Python):集群模式下的实践探索
该文介绍了使用Parallel Python (PP) 在两台物理机上构建分布式计算集群的经验。PP是一个轻量级框架,旨在简化Python代码在多处理器系统和集群中的并行执行。文中通过设置子节点的IP、端口和密钥启动PP服务器,并在主节点创建PP实例进行负载均衡。实验使用官方的质数和计算示例,显示PP在集群模式下能有效利用多台机器的多核CPU,实现计算效率的显著提升。未来,作者计划进一步研究PP在更复杂任务和大规模集群中的应用潜力。
|
25天前
|
监控 NoSQL 数据建模
使用Apache Cassandra进行分布式数据库管理的技术实践
【6月更文挑战第5天】本文探讨了使用Apache Cassandra进行分布式数据库管理的技术实践。Cassandra是一款高性能、可扩展的NoSQL数据库,适合大规模、高并发场景。文章介绍了其高可扩展性、高性能、高可用性和灵活数据模型等核心特性,并详细阐述了环境准备、安装配置、数据建模与查询以及性能优化与监控的步骤。通过本文,读者可掌握Cassandra的运用,适应不断增长的数据需求。
|
16天前
|
存储 监控 负载均衡
Zookeeper 详解:分布式协调服务的核心概念与实践
Zookeeper 详解:分布式协调服务的核心概念与实践
15 0
|
1月前
|
Cloud Native 数据管理 关系型数据库
【阿里云云原生专栏】云原生数据管理:阿里云数据库服务的分布式实践
【5月更文挑战第21天】阿里云数据库服务在云原生时代展现优势,应对分布式数据管理挑战。PolarDB等服务保证高可用和弹性,通过多副本机制和分布式事务确保数据一致性和可靠性。示例代码展示了在阿里云数据库上进行分布式事务操作。此外,丰富的监控工具协助用户管理数据库性能,支持企业的数字化转型和业务增长。
197 1
|
1月前
|
分布式计算 并行计算 Java
【分布式计算框架】 MapReduce编程初级实践
【分布式计算框架】 MapReduce编程初级实践
38 2
|
1月前
|
存储 Java 分布式数据库
【分布式计算框架】HBase数据库编程实践
【分布式计算框架】HBase数据库编程实践
36 1
|
1月前
|
分布式计算 数据可视化 Hadoop
【分布式计算框架】HDFS常用操作及编程实践
【分布式计算框架】HDFS常用操作及编程实践
28 1
|
1月前
|
存储 大数据 Apache
深入理解ZooKeeper:分布式协调服务的核心与实践
【5月更文挑战第7天】ZooKeeper是Apache的分布式协调服务,确保大规模分布式系统中的数据一致性与高可用性。其特点包括强一致性、高可用性、可靠性、顺序性和实时性。使用ZooKeeper涉及安装配置、启动服务、客户端连接及执行操作。实际应用中,面临性能瓶颈、不可伸缩性和单点故障等问题,可通过水平扩展、集成其他服务和多集群备份来解决。理解ZooKeeper原理和实践,有助于构建高效分布式系统。