开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flink cdc写hdfs文件的时候,如果开启文件合并的话,最终的文件不能通过hive映射读取吗?

flink cdc写hdfs文件的时候,文件格式设置为parquet,压缩方式为GZIP,存在一个问题,如果开启文件合并的话,最终的文件不能通过hive映射读取,如果不开启的话,可以正常读取,这个怎么解决啊?

展开
收起
小小鹿鹿鹿 2024-04-15 20:35:30 29 0
0 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
Flink峰会 - 徐榜江 立即下载
Flink CDC Meetup PPT - 龚中强 立即下载
海量数据分布式存储——Apache HDFS之最新进展 立即下载