开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks数据集成报错:脏数据是什么?

DataWorks数据集成报错:脏数据是什么?

展开
收起
游客uu65yiq7myioi 2023-01-16 11:55:30 280 0
3 条回答
写回答
取消 提交回答
  • 源头的 column 配置多了,当value类型为hash时,数据源的每行记录都需遵循相应的规范。即每行记录除key外,只能有1对attribute和value,并且attribute必须在value前面,Redis Writer方可解析出column对应的是attribute或value。 按照用户意图,应该是column只保留3列,移除不需要的列——该回答整理自钉群“DataWorks交流群(答疑@机器人)“

    2023-01-16 17:06:15
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    脏数据是writer端报的,要检查下writer端的建表语句。odps支持的数据类型与mysql大不相同,虽然可以用varchar等类型,但是通过datax实际写入是不能识别,即mysql varchar类型不能写入 odps varchar类型,需要使用string类型 ②数据同步原则:目的端数据类型范围 >>来源端数据类型值,即源端是long、varchar 、double等类型的数据,目的端均可用string、text等大范围类型接纳。

    2023-01-16 13:08:24
    赞同 展开评论 打赏
  • 脏数据是指数据中包含有错误、不一致或不完整的信息,这些信息可能会影响数据集成的结果。脏数据可能是由于输入错误、编码错误、格式错误或其他原因造成的。

    2023-01-16 12:50:22
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    Flink CDC:新一代数据集成框架 立即下载
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    《DataWorks 数据集成实时同步》 立即下载