EDAS ScheduleX 问题

简介: 浅谈 ScheduleX 简称分布式任务调度,简单的可以理解为就是一个分布式的计划任务,多台机器安装了 ScheduleX 的客户端后,用户可以在 控制台进行统计的任务调度和分配处理。 schedulerx-console 是 SchedulerX 的控制台,用于创建、管理定时任务。

浅谈

ScheduleX 简称分布式任务调度,简单的可以理解为就是一个分布式的计划任务,多台机器安装了 ScheduleX 的客户端后,用户可以在 控制台进行统计的任务调度和分配处理。

  • schedulerx-console 是 SchedulerX 的控制台,用于创建、管理定时任务。负责数据的创建、修改和查询。在产品内部与 schedulerx server 交互。
  • schedulerx-server 是 SchedulerX 的服务端,是 SchedulerX 的核心组件。负责客户端任务的调度触发以及任务执行状态的监测。
  • schedulerx-client 是 SchedulerX 的客户端。每个接入客户端的应用进程就是一个的 Worker。Worker 负责与 schedulerx-server 建立通信,让 schedulerx-server 发现客户端的机器。并向 schedulerx-server 注册当前应用所在的分组,这样 schedulerx-server 才能向客户端定时触发任务。

案例讲解

案例一:

scheduleX 的控制台界面的报警联系人是如何同步过来的?触发报警后没有通知联系人。

1

image

排查:

首先了解 scheduleX 控制台上看到的用户来源是 RAM Console 上的数据,如果你在 RAM Console 添加了一个子账号,这里就会显示出来。

通过过来的内容只有子账号信息,不包含 RAM Console 上设置的手机、描述信息等。

  • 从 RAM 控制台同步过来的账号,需要手动在控制台上,账号中心-》个人账号里面-》添加对应联系人
    image

案例二:

2018-12-19 17:40:41,522 ERROR ScxTaskProcessor-48-com.alibaba.uc.xxqg.video.res.job.CheckVideoSetAuditStatusJob-38885978-2018-12-19 17:40:30-0 -[Executor]: acknowledge failed, status:3, retryTimes:0, server:100.100.12.12:9999, instanceId:35978, id:31465, acknowledgeResult:false false 101 失败 schedulerx-default-1

DTS-heart-beat-thread-1 -[DtsClientHeartBeatTimer]: serverList is empty, clientConfig:ClientConfig [remotingThreads=32, heartBeatIntervalTime=120000, connectionTimeout=3000, groupId=1-1-3-68, zkHosts=null, namespace=zk-dts-root, zkSessionTimeout=10000, zkConnectionTimeout=10000, isSpring=true, queueSize=10000, consumerThreads=5, consumerThreadsMap=null, version=2.1.4-SNAPSHOT, pageSize=1000, pageSizeMap=null, accessKey=xxxxx, secretKey=null, localAddress=192.168.1.7, clientId=0eeb6542-21ad920:192.168.1.7, crashRetry=false, pullTaskListOverSleepTime=20000, failureJobProcessorMap=null, stopJobProcessor=null, finishLog=true, isEveryTimeNew=false, zkHostsAutoChange=true, maxBodySize=65536, environment=SchedulerX, signature=hOM8Q9au7l6Y=, jobMap=null, machine=null, domainName=schedulerx-cn-north-2.console.aliyun.com, serviceGroup=null, regionName=cn-north-2-gov-1, serviceGroupId=null, autoInit=true, isAgent=false, newInstance=true, configPath=null, connectTime=1540556330841, innerDebug=0, newVersion=false] schedulerx-default-2

排查:

按照类似的报错提示,是链接 scheduleX 的服务端失败,可以参考一下排查过程:

  • 1)检查下本机 ping schedulerx-cn-north-2.console.aliyun.com 的连通性,如果 ping 都不通肯定会报错。
  • 2)curl 测试到 domainName=schedulerx-cn-north-2.console.aliyun.com 连通性,curl -voa http://schedulerx-cn-north-2.console.aliyun.com
  • 3)如果出现类似以下信息,请工单联系阿里云
    <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
    <html>
    <head><title>301 Moved Permanently</title></head>
    <body bgcolor="white">
    <h1>301 Moved Permanently</h1>
    <p>The requested resource has been assigned a new permanent URI.</p>
    <hr/>Powered by Tengine</body>
    </html>
    
相关实践学习
微服务实战-服务注册中心 - Nacos
Nacos是阿里巴巴于2018年7月发布的一个开源项目,它是一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。Nacos 支持几乎所有主流类型的服务的发现、配置和管理: Kubernetes Service&nbsp; gRPC &amp; Dubbo RPC Service&nbsp; Spring Cloud RESTful Service &nbsp;
目录
相关文章
取消 IDEA项目结构后 100% classes, 100% lines covered 的展示
在Idea,使用快捷键`Ctrl+Alt+F6` 去掉 `Choose Coverage Suite to Display`对话框的勾选项即可。
508 6
取消 IDEA项目结构后 100% classes, 100% lines covered 的展示
【IDEA用法】IDEA新建文件自动加入SVN,删除文件自动从SVN中删除
【IDEA用法】IDEA新建文件自动加入SVN,删除文件自动从SVN中删除
831 0
|
tengine 运维 Kubernetes
阿里巴巴重磅开源云原生网关: Higress
Higress 源自阿里巴巴内部电商、交易等核心生产场景的实践沉淀,遵循 Ingress/Gateway API 标准,将流量网关、微服务网关、安全网关三合一,并在此基础上扩展了服务管理插件、安全类插件和自定义插件,高度集成 K8s 和微服务生态,包括 Nacos 注册和配置、Sentinel 限流降级等能力,并支持规则变更毫秒级生效等热更新能力。
阿里巴巴重磅开源云原生网关: Higress
|
分布式计算 并行计算 数据库
Schedulerx2.0分布式计算原理&最佳实践
1. 前言 Schedulerx2.0的客户端提供分布式执行、多种任务类型、统一日志等框架,用户只要依赖schedulerx-worker这个jar包,通过schedulerx2.0提供的编程模型,简单几行代码就能实现一套高可靠可运维的分布式执行引擎。
26744 2
|
6月前
|
人工智能 算法 NoSQL
LRU算法的Java实现
LRU(Least Recently Used)算法用于淘汰最近最少使用的数据,常应用于内存管理策略中。在Redis中,通过`maxmemory-policy`配置实现不同淘汰策略,如`allkeys-lru`和`volatile-lru`等,采用采样方式近似LRU以优化性能。Java中可通过`LinkedHashMap`轻松实现LRUCache,利用其`accessOrder`特性和`removeEldestEntry`方法完成缓存淘汰逻辑,代码简洁高效。
298 0
|
分布式计算 监控 大数据
任务调度scheduleX
【8月更文挑战第22天】
2238 0
|
安全 生物认证 数据安全/隐私保护
多因素认证(MFA)
【8月更文挑战第20天】
2716 1
|
算法 安全 Linux
Ansible自动化工具copy复制用法
Ansible 中的 copy 模块用于将文件或目录从本地计算机或远程主机复制到远程主机上的特定位置。它是一个功能强大的模块,可用于各种文件传输任务. ### 作用 将配置文件复制到远程服务器 将应用程序部署到远程服务器 将日志文件从远程服务器复制到本地计算机 备份和恢复文件和目录
457 2
Ansible自动化工具copy复制用法
|
搜索推荐 应用服务中间件 Apache
HTTP状态码301(永久重定向)不同Web服务器的配置方法
当用户或搜索引擎向服务器发出浏览请求时,服务器返回的HTTP数据流中头信息(header)中包含状态码301,以向用户表示该资源已经永久改变了位置。
983 2
|
数据采集 编解码
Google Earth Engine(GEE)——全球河流网络及相应的水资源区数据集
Google Earth Engine(GEE)——全球河流网络及相应的水资源区数据集
345 0