开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks写入 ODPS 目的表时遇到了脏数据: 如何解决?

DataWorks写入 ODPS 目的表时遇到了脏数据: 第[10]个字段 records 的数据出现错误,请检查该数据并作出修改 或者您可以增大阀值,忽略这条记录?2024-04-26 15:50:03.507 [1479578433-0-0-writer] ERROR StdoutPluginCollector -
java.lang.IllegalArgumentException: InvalidData: The string's length is more than 8388608 bytes.
at com.aliyun.odps.data.OdpsTypeTransformer.validateString(OdpsTypeTransformer.java:98)
at com.aliyun.odps.data.OdpsTypeTransformer.transform(OdpsTypeTransformer.java:250)
at com.aliyun.odps.data.OdpsTypeTransformer.transformAndValidate(OdpsTypeTransformer.java:170)
at com.aliyun.odps.data.ArrayRecord.set(ArrayRecord.java:138)
at com.aliyun.odps.data.ArrayRecord.set(ArrayRecord.java:134)
at com.aliyun.odps.data.ArrayRecord.setString(ArrayRecord.java:304)
at com.alibaba.datax.plugin.writer.odpswriter.OdpsWriterProxy.dataxRecordToOdpsRecord(OdpsWriterProxy.java:321)
at com.alibaba.datax.plugin.writer.odpswriter.OdpsWriterProxy.writeOneRecord(OdpsWriterProxy.java:232)
at com.alibaba.datax.plugin.writer.odpswriter.OdpsWriter$Task.writeByTunnelUpload(OdpsWriter.java:855)
at com.alibaba.datax.plugin.writer.odpswriter.OdpsWriter$Task.startWrite(OdpsWriter.java:755)
at com.alibaba.datax.core.taskgroup.runner.WriterRunner.run(WriterRunner.java:97)
at java.lang.Thread.run(Thread.java:853)
2024-04-26 15:50:03.747 [1479578433-0-0-writer] ERROR StdoutPluginCollector - 脏数据:
{"exception":"InvalidData: The string's length is more than 8388608 bytes.","message":"

展开
收起
cuicuicuic 2024-05-03 07:55:13 13 0
1 条回答
写回答
取消 提交回答
  • 看起来是string类型的限制 确认一下set有没有成功(生产项目的setproject) ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2024-05-03 10:07:28
    赞同 1 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关电子书

更多
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载