xxljob执行源码分析

简介: 本文深入解析XXL-JOB分布式任务调度框架源码,涵盖架构设计、核心执行流程与关键线程池机制。内容包括任务触发、注册、失败重试、日志报告及时间轮调度原理,结合带中文注释的源码包与分析导图,全面剖析其高性能设计实现。

已包含中文注释的源码压缩包:📎xxl-job-master.zip

分析流程:📎xxljob直播.xmind

1.架构分析

2.执行源码

核心代码位置如下:

1-initI18n()

  • 初始化国际化资源,对应配置文件:resources:i18n

2-JobTriggerPoolHelper.toStart()

触发器线程池:创建快慢线程池,提升任务执行效率

  • 如果一个任务在1min内超过10次提交,就默认是慢任务,为了防止慢任务影响系统吞吐量,将其放在慢线程池中运行
  • 快线程池定义:最大线程数=200,等待队列=1000
  • 慢线程池定义:最大线程数=100,等待队列=2000

addTrigger方法

  • 默认选择快线程池,如果任务在1min内超过10次提交,就是慢线程池
  • 真正的触发器操作代码

3-JobRegistryHelper.getInstance().start()

任务注册器线程池:将上线机器刷新(最近90s有心跳),将下线机器移除(90s内没心跳),更新执行组

  • 初始化服务上线/下线线程池:将新增的IP添加到组中,将断线的IP及时清理(因为执行器会上下线,xxl-job会保证及时更新当前在线的执行器)
  • 初始化心跳检测的线程池:xxl-job会把心跳信息保存在xxl_job_registry,借助心跳检测机制,保证机器下线能够及时清楚,机器上线及时发现

4-JobFailMonitorHelper.getInstance().start()

重试报警机制:因为任务是异步调用,需要有一个进程持续监听执行结果,主要做的是:读取本地数据,更新数据状态,未达到失败次数就重试,达到失败次数就告警

  • 借助mybatis查询本地数据库执行失败、且告警状态=0[未告警]的数据日志ID,读取表:xxl_job_log
  • 更新告警状态=-1[锁定,避免多线程并发干扰],0-默认、-1=锁定状态、1-无需告警、2-告警成功、3-告警失败
  • 基于日志ID取出完整的日志信息,读取表:xxl_job_log
  • 基于ID获取失败日志对应的任务信息,读取表:xxl_job_info
  • 如果失败任务可充实次数大于0,表示还能重试,就继续重试
  • 如果配置了告警信息,就实现报警
  • 报警后更新本地告警状态,2或3

5-JobCompleteHelper.getInstance().start()

调度系统调度执行器后,执行器突然宕机,调度系统就可以根据这个线程感知任务到底执行成功还是失败

  • 任务结果丢失处理:调度记录停留在 "运行中" 状态超过10min,且对应执行器心跳注册失败不在线,则将本地调度主动标记失败;

6-JobLogReportHelper.getInstance().start()

  • 清理过期日志,没什么需要详细讲解的

7-JobScheduleHelper.getInstance().start()

从xxl_job_info表中找出当前时间+5s的所有执行器数据,然后根据其调度时间判断立即调度还是加入时间戳

  • 取出当前时间 + 5s内所有待执行的执行器数据(避免循环本身导致错过执行时间)
  • 建立数据库链接
  • 关闭事务的自动提交
  • 悲观锁,锁定数据
  • 过期处理策略

可能过期的原因:服务重启;调度线程被阻塞,线程被耗尽;上次调度持续阻塞,下次调度被错过

  • 从数据库取出当前时间+5s的所有任务
  • 当前时间:超过调度时间+5s
  • 判断任务执行状态是否是:FIRE_ONCE_NOW,如果是就立马调度一次
  • 刷新调度时间,避免下一次再错过
  • 当前时间:超过调度时间,但还没超过5s
  • 调度一次
  • 更新调度时间,避免下一次再错过
  • 当前时间:没超过调度时间,把调度时间加入到时间轮中
  • 获取调度时间的秒
  • 将调度时间作为key,任务id作为value,放进调度任务时间轮的map中(其执行代码在:238行)
  • 刷新下一次调度时间(这里就不是new Date()了,而是真实的执行时间)
  • 更新每一个任务的最近一次执行时间、下一次执行时间、执行状态

时间轮执行原理

时间轮执行原理:com.xxl.job.admin.core.thread.JobScheduleHelper#ringThread

  • 先延迟0-1秒,以保证加载所有数据
  • 获取当前时间对应的秒数
  • 避免处理耗时太长,跨过刻度,向前校验一个刻度
  • 这里的ringData就是上面场景3中添加进去的数据,当前文件代码:149行
  • 当前秒+1是为了防止时间轮中的任务由于意外没有执行,从而有一个补偿机制
  • 调度任务
  • 清空已处理数据

相关文章
|
6月前
|
Java 数据库连接 调度
xxljob执行源码分析
本文深入解析XXL-JOB源码,涵盖架构设计、核心执行流程与关键线程机制。包括任务调度、快慢线程池分离、注册与心跳检测、失败重试告警、日志清理及时间轮原理,结合图文详解各组件实现逻辑,助你全面掌握分布式任务调度底层机制。
 xxljob执行源码分析
|
6月前
|
存储 算法 BI
xxljob本地运行
本文介绍XXL-JOB分布式任务调度框架的本地部署与使用流程,涵盖源码获取、服务端数据库初始化、配置修改、服务启动及客户端注册执行器等步骤,并演示如何配置调度任务、选择路由策略及测试执行效果,帮助快速上手使用。
 xxljob本地运行
|
负载均衡 Java API
分布式任务调度框架:XXL-JOB(入门篇)
将调度行为抽象形成“调度中心”公共平台,而平台自身并不承担业务逻辑,“**调度中心**”负责发起调度请求。将任务抽象成分散的JobHandler,交由“执行器”统一管理,“**执行器**”负责接收调度请求并执行对应的JobHandler中业务逻辑。因此,“调度”和“任务”两部分可以相互解耦,提高系统整体稳定性和扩展性;
2881 0
分布式任务调度框架:XXL-JOB(入门篇)
|
Oracle Java 关系型数据库
三分钟拿下dbeaver企业版
数据库管理工具Dbeaver,开源的企业版,功能丰富
4151 0
三分钟拿下dbeaver企业版
|
存储 Java
从ThreadLocal谈到TransmittableThreadLocal,从使用到原理2
从ThreadLocal谈到TransmittableThreadLocal,从使用到原理
1623 0
|
前端开发 Java 调度
XXL-JOB 日志表和日志文件自动清理
XXL-JOB 日志表和日志文件自动清理
|
Java 调度 数据库
SpringBoot整合XXL-JOB【05】- 任务分片
在实际业务中,批量定时任务可能因上一批任务未完成而影响业务。为解决此问题,本文介绍如何使用Xxl-job对批量任务进行分片处理,通过分片广播形式调度集群机器并行执行任务,大幅提升执行效率。具体步骤包括环境准备、添加依赖和配置、声明实体类与查询类,以及改造业务逻辑实现分片查询。测试结果显示,分片处理将两千条数据的执行时间从30秒缩短至15秒,性能提升显著。
2412 13
SpringBoot整合XXL-JOB【05】-  任务分片
|
缓存 Java 开发工具
Spring是如何解决循环依赖的?从底层源码入手,详细解读Spring框架的三级缓存
三级缓存是Spring框架里,一个经典的技术点,它很好地解决了循环依赖的问题,也是很多面试中会被问到的问题,本文从源码入手,详细剖析Spring三级缓存的来龙去脉。
2359 24
Spring是如何解决循环依赖的?从底层源码入手,详细解读Spring框架的三级缓存
|
消息中间件 存储 监控
七种常见分布式事务详解(2PC、3PC、TCC、Saga、本地事务表、MQ事务消息、最大努力通知)
七种常见分布式事务详解(2PC、3PC、TCC、Saga、本地事务表、MQ事务消息、最大努力通知)
6975 0
|
druid Java 关系型数据库
在Spring Boot中集成Druid实现多数据源有两种常用的方式:使用Spring Boot的自动配置和手动配置。
在Spring Boot中集成Druid实现多数据源有两种常用的方式:使用Spring Boot的自动配置和手动配置。
3971 5