DolphinScheduler 调度工作流报错 Host key verification failed.

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
简介: DolphinScheduler调度任务失败,错误显示"Host key verification failed."。问题可能在于SSH免密登录配置失效或租户不存在于Linux系统中。解决方案:检查SSH配置并确保调度用户有管理员权限;确认DolphinScheduler租户与Linux用户对应。如果日志仅显示主机键验证失败,可能忽略了租户与操作系统用户的对应关系。创建具备管理员权限的新租户可解决。此外,当失败策略设为"继续"时,可能无法查看失败日志,建议使用"结束"策略。

@[toc]

出现问题

在执行调度任务时,失败了,查看日志发现错误 —— Host key verification failed.

在这里插入图片描述

错误原因及解决方法

1.SSH 免密登录配置失败、失效

这种情况就检查一下对应的用户是否能够免密登录到其它机器,不能的话就重新配置一下免密。

注意,调度用户需要具有管理员 sudo 权限。

2.不存在该租户

DolphinScheduler 中的租户与 Linux 系统中的用户是对应的,也就是说,调度用户必须存在于 Linux 系统中,且配置了管理员权限

我碰到的就是这种情况,但日志中只有如下所示的信息:

[INFO] 2024-04-16 06:38:51.518 +0000 -  -> Host key verification failed.

并没有下面的提示信息:

[INFO] 2024-04-16 06:38:51.518 +0000 -  -> Could not create directory '/home/work/.ssh'.

导致我刚开始认为是我的 SSH 配置问题,后面验证过发现 SSH 正常,才想起来租户要与操作系统的用户对应。

不过 DolphinScheduler 在创建租户时就进行了提示,太粗心啦!!!



这种情况重新创建一个具有管理员权限的租户即可解决。

建议

在调度多个任务时,如果你选择的失败策略是【继续】,那么可能会导致你即使失败了,也看不到相关的日志,它应该会重复执行,我不知道这算不算 DolphinScheduler 的 BUG,我碰到了这种情况,失败策略选择【结束】时,则不会出现这种情况。



相关文章
|
2月前
|
数据中心
【Azure Service Bus】创建 ServiceBus 的Terraform脚本报错GetAuthorizationRule: Invalid input
为了最佳的体验,需要确保使用最新 Terraform azurerm 组件!
|
5月前
|
存储 调度 Apache
airflow scheduler 这些命令是什么作用
【6月更文挑战第30天】airflow scheduler 这些命令是什么作用
49 0
|
6月前
|
Kubernetes 容器
Warning FailedScheduling 14m (x12 over 16m) default-scheduler 0/1 nodes are available: 1 node(s
Warning FailedScheduling 14m (x12 over 16m) default-scheduler 0/1 nodes are available: 1 node(s
123 0
|
6月前
|
资源调度
在SchedulerX中,你可以使用`schedulerx.output()`函数来向Worker报告运行结果
【1月更文挑战第7天】【1月更文挑战第35篇】在SchedulerX中,你可以使用`schedulerx.output()`函数来向Worker报告运行结果
45 1
|
Kubernetes API 容器
Kubenetes 添加节点报错—couldn‘t validate the identity of the API Server
Kubenetes 添加节点报错—couldn‘t validate the identity of the API Server
1041 0
|
机器学习/深度学习 Kubernetes 关系型数据库
gitlab--job 作业运行控制 tag、when、allow_failure、retry、timeout、parallel
gitlab--job 作业运行控制 tag、when、allow_failure、retry、timeout、parallel
|
数据库
This scheduler instance (XXXXX) is still active but was recovered by another
This scheduler instance (XXXXX) is still active but was recovered by another
233 0
|
Java Spring
Seata Failed to get available servers: endpoint format should like ip:port 报错原因/解决方案汇总版(看完本文必解决问题)
Seata Failed to get available servers: endpoint format should like ip:port 报错原因/解决方案汇总版(看完本文必解决问题)
980 0
Seata Failed to get available servers: endpoint format should like ip:port 报错原因/解决方案汇总版(看完本文必解决问题)
|
数据库
This scheduler instance is still active but was recovered by another instance in the cluster
This scheduler instance is still active but was recovered by another instance in the cluster
873 0
|
关系型数据库 MySQL
nodejs.ER_NOT_SUPPORTED_AUTH_MODEError: ER_NOT_SUPPORTED_AUTH_MODE:
nodejs.ER_NOT_SUPPORTED_AUTH_MODEError: ER_NOT_SUPPORTED_AUTH_MODE:
115 0

相关实验场景

更多