DataWorks常见报错场景覆盖数据同步任务与数据源-开发者社区-阿里云

DataWorks操作报错合集之离线同步任务中，把表数据同步到POLARDB，显示所有数据都是脏数据，报错信息：ERROR JobContainer - 运行scheduler 模式[local]出错.是什么原因

2024-06-10 796

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

问题一：dataworks重试也失败，什么原因？

dataworks重试也失败？任务oneclickOdps_polardb_to_odps_first_day_extra_level_mergeInto执行失败？日志：2023-12-19 00:11:39.832 [main] [ERROR] com.aliyun.odps.dma.merger_new.utils.JobUtils - Instance error: [ Instance: 2023121816083370gwua9snu2gg, Status: FAILED

result: ODPS-0121145:time out of range, input -62170185600, must be in [-62167305600, 253402387200]

参考回答：

time out of range, input -62170185600, must be in [-62167305600, 253402387200]-------上游实时任务一直是正常运行的吗，这个报错是在什么情况下出现的完整的日志文本也帮忙发一下

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/581661

问题二：dataworks的离线同步任务中，报错是什么原因？

dataworks的离线同步任务中，我想把dataworks的表数据同步到POLARDB，报错是什么原因？并且显示所有数据都是脏数据？ERROR JobContainer - 运行scheduler 模式[local]出错.

2023-12-18 03:41:42.855 [job-18286291] ERROR JobContainer - Exception when job run

com.alibaba.datax.common.exception.DataXException: Code:[Framework-14], Description:[The dirty data transmitted by DataX exceeds user expectations. This error often occurs when a lot dirty data exists in the source data. Please carefully check the dirty data log information reported by DataX, or you can tune up the dirty data threshold value. ]. - Check for the number of dirty data entries has not passed. The limit is [0] entries, but [10] entries have been captured.

at com.alibaba.datax.common.exception.DataXException.asDataXException(DataXException.java:34) ~[datax-common-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.util.ErrorRecordChecker.checkRecordLimit(ErrorRecordChecker.java:55) ~[datax-core-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.job.scheduler.AbstractScheduler.schedule(AbstractScheduler.java:111) ~[datax-core-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.job.JobContainer.schedule(JobContainer.java:747) ~[datax-core-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.job.JobContainer.start(JobContainer.java:219) ~[datax-core-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.Engine.start(Engine.java:118) [datax-core-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.Engine.entry(Engine.java:343) [datax-core-0.0.1-SNAPSHOT.jar:na]

at com.alibaba.datax.core.Engine.main(Engine.java:392) [datax-core-0.0.1-SNAPSHOT.jar:na]

参考回答：

任务中产生了脏数据并且任务设置了不能容忍脏数据

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/581651

问题三：DataWorks有些任务没有运行，我想kill掉这些，但是又报错如下，可以怎么解决？

DataWorks有些任务没有运行，我想kill掉这些，但是又报错如下，可以怎么解决？

参考回答：

未运行的任务大概率是上游未运行完成或者有失败的只要有一个上游是失败了补数据任务就会置为失败未运行的也不会再执行 30天后系统自动回收

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/581648

问题四：用DataWorks连接ClickHouse出现这个错误，怎么处理？

用DataWorks连接ClickHouse出现这个错误，怎么处理？此数据源不可被当前资源组连通，具体错误信息为：具体错误信息为：ErrorMessage:[Incorrect url

ExtraInfo:Resource Group IP:["","(Primary)"],HostName:cn-shenzhen.629189971779874.17012418828271,]Request id: 6bbd2128-e3e0-4c64-92d4-e24284e97542

参考回答：

\"Access denied\",\"unable to authenticate user\",\"invalid username/password\",\"Invalid username/password\ hover报错有显示ak问题么

确认看下ak是否有效

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/581646

问题五：DataWorks配置ES离线同步到odps , 他一直报这个日期转型报错, 这个咋整?

"DataWorks配置ES离线同步到odps , 他一直报这个日期转型报错, 可是配置里面又没有能让我选择日期转形的配置 ,这个咋整? 是不是只能用脚本模式配置？

参考回答：

对的如果index本身创建时没有指定dateFormat的话同步任务需要参考文档转脚本配置一下dateFormat

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/581641

DataWorks操作报错合集之离线同步任务中，把表数据同步到POLARDB，显示所有数据都是脏数据，报错信息：ERROR JobContainer - 运行scheduler 模式[local]出错.是什么原因

问题一：dataworks重试也失败，什么原因？

问题二：dataworks的离线同步任务中，报错是什么原因？

问题三：DataWorks有些任务没有运行，我想kill掉这些，但是又报错如下，可以怎么解决？

问题四：用DataWorks连接ClickHouse出现这个错误，怎么处理？

问题五：DataWorks配置ES离线同步到odps , 他一直报这个日期转型报错, 这个咋整?

大数据开发治理DataWorks

热门文章

最新文章

相关产品

相关课程

相关电子书