DolphinScheduler 调度工作流报错 Host key verification failed.

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: DolphinScheduler调度任务失败,错误显示"Host key verification failed."。问题可能在于SSH免密登录配置失效或租户不存在于Linux系统中。解决方案:检查SSH配置并确保调度用户有管理员权限;确认DolphinScheduler租户与Linux用户对应。如果日志仅显示主机键验证失败,可能忽略了租户与操作系统用户的对应关系。创建具备管理员权限的新租户可解决。此外,当失败策略设为"继续"时,可能无法查看失败日志,建议使用"结束"策略。

@[toc]

出现问题

在执行调度任务时,失败了,查看日志发现错误 —— Host key verification failed.

在这里插入图片描述

错误原因及解决方法

1.SSH 免密登录配置失败、失效

这种情况就检查一下对应的用户是否能够免密登录到其它机器,不能的话就重新配置一下免密。

注意,调度用户需要具有管理员 sudo 权限。

2.不存在该租户

DolphinScheduler 中的租户与 Linux 系统中的用户是对应的,也就是说,调度用户必须存在于 Linux 系统中,且配置了管理员权限

我碰到的就是这种情况,但日志中只有如下所示的信息:

[INFO] 2024-04-16 06:38:51.518 +0000 -  -> Host key verification failed.

并没有下面的提示信息:

[INFO] 2024-04-16 06:38:51.518 +0000 -  -> Could not create directory '/home/work/.ssh'.

导致我刚开始认为是我的 SSH 配置问题,后面验证过发现 SSH 正常,才想起来租户要与操作系统的用户对应。

不过 DolphinScheduler 在创建租户时就进行了提示,太粗心啦!!!



这种情况重新创建一个具有管理员权限的租户即可解决。

建议

在调度多个任务时,如果你选择的失败策略是【继续】,那么可能会导致你即使失败了,也看不到相关的日志,它应该会重复执行,我不知道这算不算 DolphinScheduler 的 BUG,我碰到了这种情况,失败策略选择【结束】时,则不会出现这种情况。



相关文章
|
6天前
|
弹性计算 移动开发 Serverless
Serverless 应用引擎操作报错合集之部署stable启动时出现:Function instance health check failed on port 5000 in 120 seconds该怎么解决
Serverless 应用引擎(SAE)是阿里云提供的Serverless PaaS平台,支持Spring Cloud、Dubbo、HSF等主流微服务框架,简化应用的部署、运维和弹性伸缩。在使用SAE过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
1月前
|
Kubernetes 容器
Warning FailedScheduling 14m (x12 over 16m) default-scheduler 0/1 nodes are available: 1 node(s
Warning FailedScheduling 14m (x12 over 16m) default-scheduler 0/1 nodes are available: 1 node(s
62 0
|
1月前
|
资源调度
在SchedulerX中,你可以使用`schedulerx.output()`函数来向Worker报告运行结果
【1月更文挑战第7天】【1月更文挑战第35篇】在SchedulerX中,你可以使用`schedulerx.output()`函数来向Worker报告运行结果
22 1
|
8月前
|
Kubernetes API 容器
Kubenetes 添加节点报错—couldn‘t validate the identity of the API Server
Kubenetes 添加节点报错—couldn‘t validate the identity of the API Server
724 0
|
10月前
|
机器学习/深度学习 Kubernetes 关系型数据库
gitlab--job 作业运行控制 tag、when、allow_failure、retry、timeout、parallel
gitlab--job 作业运行控制 tag、when、allow_failure、retry、timeout、parallel
|
10月前
|
数据库
This scheduler instance (XXXXX) is still active but was recovered by another
This scheduler instance (XXXXX) is still active but was recovered by another
177 0
|
数据库
This scheduler instance is still active but was recovered by another instance in the cluster
This scheduler instance is still active but was recovered by another instance in the cluster
464 0
|
关系型数据库 MySQL
nodejs.ER_NOT_SUPPORTED_AUTH_MODEError: ER_NOT_SUPPORTED_AUTH_MODE:
nodejs.ER_NOT_SUPPORTED_AUTH_MODEError: ER_NOT_SUPPORTED_AUTH_MODE:
|
存储 分布式计算 Kubernetes
【k8s系列3】kubernetes(k8s) scheduler backend 调度的实现
【k8s系列3】kubernetes(k8s) scheduler backend 调度的实现
244 0
【k8s系列3】kubernetes(k8s) scheduler backend 调度的实现
|
jenkins 持续交付 开发工具

热门文章

最新文章

相关实验场景

更多