文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink中parquet文件的类型是在建表的时候指定的么？

Flink中parquet文件的类型是在建表的时候指定的么？

展开

收起

冰激凌甜筒 2023-04-23 15:30:42 319 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

微笑向日葵

不是，你要在shell-shell的那个黑框命令行里面，读取一下你的parquet文件，然后打印下他的Schema,再跟你的hive表的建表语句：show create table ***里面的字段类型逐一compare一下，然后看看他们的differentia，一般应该是parquet的schema里面有个long类型，被你hive里面该字段定义成了int，或者相反，不兼容导致的； spark.read.parquet("/tmp/output/people.parquet")..printSchema()，parquet和orc都是带schema的文件，简单理解就是自带字段和字段类型的文件，你的hive建表语句选类型的时候要与之对应，不能像csv或者txt一样那么的为所欲为，此回答整理自钉群“【③群】Apache Flink China社区”

2023-04-23 15:50:11

赞同展开评论

问答分类：

实时计算 Flink版

问答标签：

实时计算 Flink版parquet文件实时计算 Flink版在建

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink

flink cdc读parquet格式数据报这个错误谁遇到过啊？

289

1

0

flink cdc paimon设置了file.format为parquet但生成的文件依然是orc

559

1

0

Flink在oss并没有生成文件是为什么？

276

1

0

在Flink CDC中，怎么没字段 hdfs上文件也是空的？

229

0

0

在Flink CDC中，flinsql读spark表的timestamp类型字段报这个错，这个咋解决

199

0

0

咨询一个flink mysql cdc的问题，一个表的字段a在建表的时候设置的默认值是1？

236

2

0

对于Flink CDC，看起来像是yaml文件里哪块没写对，但是没显示具体是那行？

241

1

0

获取Flink MAP类型中的entries数量

239

1

0

Flink解析文件

191

1

0

Flink CDC里mysql to doris的pipeline方式不支持datatime类型吗？

221

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Flink CDC 3.6.0：支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

相约深圳，全球征集｜Flink Forward Asia 2026 演讲议题征集正式启动

Flink Agents 0.3 Roadmap解读

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

Skill即服务：用Agent安全玩转云上Flink

热门讨论

热门文章

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

Flink CDC刚刚写了几条数据，但是里面有点问题，其他字段都是正常的。这是咋回事呀？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

有用flink cdc同步mysql到hive这样搞过的源码吗?

有人遇到flink打不开web界面吗？

flink k8s navtive application 这种部署模式怎么发布算子啊？

Flink On Docker 启动 jm 时报这个错误请问有知道这个错误的原因吗？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

展开全部

数据仓库介绍与实时数仓案例

通过Flink实时构建搜索引擎的索引

接着！！Apache Flink 全领域干货合集（持续更新）

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

Apache Flink 漫谈系列(04) - State

使用 Kafka 和 Flink 构建实时数据处理系统

日均百亿级日志处理：微博基于 Flink 的实时计算平台建设

携程实时智能检测平台建设实践

展开全部

还有其他疑问?