备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks数据集成报错：脏数据是什么？

DataWorks数据集成报错：脏数据是什么？

展开

收起

wenti 2023-01-16 11:55:30 419 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

665661

源头的 column 配置多了，当value类型为hash时，数据源的每行记录都需遵循相应的规范。即每行记录除key外，只能有1对attribute和value，并且attribute必须在value前面，Redis Writer方可解析出column对应的是attribute或value。按照用户意图，应该是column只保留3列，移除不需要的列——该回答整理自钉群“DataWorks交流群(答疑@机器人)“

2023-01-16 17:06:15

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

脏数据是writer端报的，要检查下writer端的建表语句。odps支持的数据类型与mysql大不相同，虽然可以用varchar等类型，但是通过datax实际写入是不能识别，即mysql varchar类型不能写入 odps varchar类型，需要使用string类型 ②数据同步原则：目的端数据类型范围 >>来源端数据类型值，即源端是long、varchar 、double等类型的数据，目的端均可用string、text等大范围类型接纳。

2023-01-16 13:08:24

赞同展开评论
认真学习的heart

脏数据是指数据中包含有错误、不一致或不完整的信息，这些信息可能会影响数据集成的结果。脏数据可能是由于输入错误、编码错误、格式错误或其他原因造成的。

2023-01-16 12:50:22

赞同展开评论

问答分类：

DataWorks 数据集成 Data Integration 大数据开发治理平台 DataWorks

问答标签：

dataworks数据集成 Data Integration报错数据集成 Data Integration报错大数据开发治理平台 DataWorks数据集成报错大数据开发治理平台 DataWorks脏数据大数据开发治理平台 DataWorks报错脏数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks任务运行过程中遇到源端表某字段数据过长在不增大脏数据限制条数的前提下，怎么解决呢？

155

1

0

DataWorks同步解决方案mysql一键实时同步Datahub报脏数据

156

1

0

Hologres与数据集成同步报错insufficient data left in mess...

322

1

0

DataWorks的数据集成报错Java heap space

174

1

0

Dataworks报错脏数据String["1"]不能转为Long

164

1

0

DataWorks调度触发常规情况下是没有什么问题，比如有一些表污染了，出现某些脏数据？

110

1

0

DataWorks数据集成同步到全密态mysql 报错？

138

1

0

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

1052

1

0

DataWorks在把数据从odps同步到holo的时候，我看不懂这个脏数据是什么原因能帮我看下吗？

178

1

0

大数据计算MaxCompute的数据集成这块报错是什么原因？

156

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

【赵渝强老师】阿里云大数据集成开发平台DataWorks

阿里云大数据AI产品月刊-2025年8月

智能体创业新风口：从算法开发到IP运营的范式转移——AI智能体如何重塑创新创业的底层逻辑

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

Forrester Wave™: AI Platforms in China, Q4 2025发布，阿里云入选领导者

热门讨论

热门文章

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

DataWorks创建表提交到开发、生产环境时报错：列名包含关键字，请修改列名 date，如何解决？

数据来源：com.alibaba.fastjson.JSONException: syntax er

Dataphin和 Dataworks 有啥区别呢？

DataWorks还有一个问题,我这个实时同步任务每7天failover一次,这个正常吗？

dataworks新增mysql数据源-ecs自建数据库，连通性测试报错，这个怎么解决呢？

阿里云磁盘大小是多少？

DataWorks运维中心的运行诊断功能在进行任务诊断时包括哪几部分？

DataWorks常见问题实时任务，运行报错：？

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

展开全部

云上一指禅：大数据产品DataWorks每日问答

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

数据管理能力成熟度模型

语雀+通义千问+DataWorks，让AI定期推送每周总结

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

基于DataWorks搭建新零售数据中台

DataWorks产品使用合集之怎么选择Doris或StarRocks作为DataWorks的OLAP解决方案

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

展开全部

还有其他疑问?