文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks的hive writer parquent存储bigint类型

已解决

DataWorks的hive writer parquent存储bigint类型

2021-12-23 12:30:35.356 630912445-0-0-writer ERROR StdoutPluginCollector - 脏数据: {"exception":"error starting field servertimestamp at 10","message":"error starting field servertimestamp at 10","record":{"byteSize":8,"index":0,"rawData":1640058849855,"type":"LONG"},。。。com.alibaba.datax.common.exception.DataXException: Code:HdfsWriter-04, Description:您配置的文件在写入时出现IO异常.. - java.lang.ClassCastException: parquet.io.PrimitiveColumnIO cannot be cast to parquet.io.GroupColumnIO

展开

收起

阿里云服务支持 2022-12-09 15:11:46 600 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

阿里云服务支持

推荐回答

官方回答

hive writer parquent存储bigint类型需要parameter里增加参数 "dataxParquetMode": "fields"

加该参数原因：这个是写parquet的实现有不同，不加这个参数是个老模式，那个模式处理null的情况会有些限制，源端bigint字段有null就会报错。

2022-12-09 15:18:29

赞同展开评论

问答分类：

SQL 存储 DataWorks HIVE 大数据开发治理平台 DataWorks 数据集成 Data Integration

问答标签：

Hive存储大数据开发治理平台 DataWorks类型 dataworks Hive 大数据开发治理平台 DataWorks hive 大数据开发治理平台 DataWorks存储

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks完全不同的两种类型做比较，结果竟然相等（python）？

216

1

0

dataworks里面的hologres，256个CU大概有多少的存储空间呀？

242

2

0

dataworks里面的hologres，256个CU大概有多少的存储空间呀？

158

1

0

DataWorks中Delta Table和普通表在存储和和查询上会有很大的资源消耗上的区别吗？

144

0

0

DataWorks支持的任务类型都有什么？

128

1

0

大数据计算MaxCompute这种外部表直连的，要选 Hive 兼容类型吗？

120

1

0

dataworks的MaxCompute配额（30CU）相当于CPU和存储资源多少？

603

13

0

DataWorks可以把timestamp转成date吐给lindorm writer阿妈？

142

0

0

DataWorks中string类型怎么转化成日期格式 yyyy-MM-dd？

233

1

0

各位，Flink 的离线计算的数据是怎么存放的？是存在 HDFS（或Hive）上的吗？

1928

6

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

阿里云支持与服务

2305

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

相关文章

实战：用飞算JavaAI专业版写一个完整的博客系统

阿里云百炼知识库如何计费？标准版 / 旗舰版 + Token 收费实例全算清

阿里云服务器多少钱一年？新老用户差价惊人，2026优惠政策解读

阿里云服务器多少钱一年？一般人不知道的特价购买方式，秒杀最低38元1年

ossftp结合FileZilla在公网使用

相关解决方案

更多

SelectDB实现日志高效存储与实时分析

高效存储和处理多媒体数据

高可用及共享存储 Web 服务

轻松实现客服数据智能分析与高效存储

视频网站的存储与媒体处理方案

热门讨论

热门文章

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

DataWorks表管理创建表报precision and scale is not current

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

如何使用DataWorks数据集成从MySQL导入数据到GDB配置同步任务脚本？

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

问下 left anti join 用法跟 not exists 的区别是什么？

数据来源：com.alibaba.fastjson.JSONException: syntax er

在DataWorks中为什么运维中心还显示它有一个直接下游依赖？

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

展开全部

云上一指禅：大数据产品DataWorks每日问答

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks售前咨询

DataWorks常见问题之一样IP的分库只有部分网络连通如何解决

大数据公共数据集上线，免费试用TB级数据分析

Qwen3 X DataWorks ：为数据开发与分析加满Buff !

DataWorks操作报错合集之如何处理数据同步时（mysql->hive）报：Render instance failed

展开全部

还有其他疑问?