文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks数据集成HDFS插件parquetSchema如何配置

已解决

DataWorks数据集成HDFS插件parquetSchema如何配置

展开

收起

阿里云服务支持 2022-12-14 10:50:49 378 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

阿里云服务支持

推荐回答

官方回答

parquetSchema的完整HDFSReader配置样例，如下：

"parquetSchema": "message m { optional int32 minute_id;optional int32 dsp_id;optional int32 adx_pid;optional int64 req;optional int64 res;optional int64 suc;optional int64 imp;optional double revenue; }"

注意：里面的内容不要分行。

详情请参考 HDFS Reader。

2022-12-14 10:57:09

赞同展开评论

问答分类：

DataWorks 数据集成 Data Integration 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks集成集成配置大数据开发治理平台 DataWorks数据集成集成插件大数据开发治理平台 DataWorks配置

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks的hdfs的reader的date类型是什么

163

1

0

我需要用datawork连接需要Kerberos认证的hdfs数据源，但是通过数据集成，数据源

191

1

0

DataWorks在odps上有一个kafka同步到es的离线任务任务是这么配置的？

129

1

0

在你们的湖仓一体架构中，Iceberg是如何与Hive和HDFS集成的？

506

1

0

在Hologres中，Dataworks 那边提交的？有没有check 过主键配置，及主键更新策略?

113

1

0

DataWorks如果配置同步任务生成的节点是孤立节点，第二天不能正常调度吗？

156

1

0

DataWorks数据集成hdfs插件parquetSchema配置

147

1

0

DataWorks现在同一个源头得数据写入到hdfs上面一个3.5G得表只需要20分钟怎么办？

193

11

0

DataWorks的hivereader_readMode用hdfs方式可同步array类型

112

1

0

云原生大数据计算服务 MaxCompute数据上云方面，DataWorks数据集成是怎样的？

1314

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

阿里云支持与服务

2305

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

相关文章

拒绝“数据断层”：高质量舆情分析背后的隐形功臣——动态节点池

OpenClaw + ClaudeCode 在企业数据仓库开发中的实践

告别先开发后治理：Agent 驱动的数据质量一体化交付

AI时代下，中小团队数据治理的轻量化落地指南

阿里云大数据 AI 产品月刊-2026年3月

热门讨论

热门文章

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

数据来源：com.alibaba.fastjson.JSONException: syntax er

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

在DataWorks中为什么运维中心还显示它有一个直接下游依赖？

在智能数据建模中涉及的FML是什么的缩写，什么意思？

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

DataWorks有一个中文字断，左右进行了去除空格处理，这种有什么办法找到两条的区别吗？

数据服务报429请求次数过多咋办呀

DataWorks中78xxxxx_out的输出是什么?

展开全部

拒绝“数据断层”：高质量舆情分析背后的隐形功臣——动态节点池

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

DataWorks售前咨询

云上一指禅：大数据产品DataWorks每日问答

DataWorks常见问题之一样IP的分库只有部分网络连通如何解决

语雀+通义千问+DataWorks，让AI定期推送每周总结

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

展开全部

还有其他疑问?