文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

我想使用FlinkSink写hdfs使用snappy压缩代码是这样写（参考下列）提交后报错是为什么？

我想使用FlinkSink写hdfs。使用snappy压缩。代码是这样写的： CompressWriterFactory writer = CompressWriters.forExtractor(new DefaultExtractor()) .withHadoopCompression(codec, conf);

    FileSink<JSONObject> sink = FileSink
            .forBulkFormat(new Path(outputPath), writer)

提交到yarn上后报错：请问是什原因？

展开

收起

圆葱猪肉包 2023-03-08 11:07:54 740 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

我是三好学生

缺少so？高低版本混用？基本就是依赖的问题。你的包里是不是打了啥不该打的jar。遇到这种问题得分析你自己的依赖引用关系大概率是高低版本混用。大概率你的jar打包有问题。感觉你是不看第三方库依赖树疯狂引用依赖不分运行时和编译时依赖觉得本地运行没问题集群运行就没问题了。此答案出自钉群“【③群】Apache Flink China社区”

2023-03-08 12:00:38

赞同展开评论

问答分类：

编解码资源调度实时计算 Flink版

问答标签：

文件存储HDFS版代码文件存储HDFS版报错文件存储HDFS版压缩 flinksink文件存储HDFS版 flinksink文件存储HDFS版压缩

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

dataworks配置带kerberos认证的hdfs数据源，报错io异常 couldn't ？

836

2

0

Flink中 StreamFileSink 写 hdfs 这个报错是啥原因吗？

289

1

0

Flink指定chepoint为hdfs路径，启动job报错。有人遇到此问题吗？

227

1

0

Flink报错：是不是必须要指向HDFS的目录？

216

1

0

通过flink sql把数据写入hdfs，如何设置对生产的文件进行压缩？

682

1

0

EMR报错提示oss://yourbucket/***/***/***”或“hdfs://yo...

274

1

0

请教下 flink 报错 hdfs dfs -ls 可以正常执行吗？

310

2

0

在Flink这个oss key 可以正常访问 hudi的 oss-hdfs，但这里就报错了，为什么？

244

1

0

DataWorks连接本地虚拟机的hdfs,报错，连接超时，怎么解决？

299

3

0

DataWorks中Hdfs读取，漏数据什么情况？无报错，1700万数据，漏了1100w

271

2

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

出海企业技术架构升级：如何高效治理多区域、多平台的云资源

最新版阿里云 HappyHorse-1.1 系列模型功能介绍

当“眼见为实”失效：拆解 AI 跨模态鉴伪的技术栈、工程边界与落地路径【AI图像鉴伪】

OMI/Aura 臭氧(O3)剖面 1-轨道 L2 条带 13x48km V003 (OMO3PR)位于 GES DISC

番茄病害目标检测数据集：9类别、5,000张图像 | 目标检测

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

Flink cdc sqlserver 希望不同步某些数据行

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC 能适配达梦不？

Flink CDC底层监听是不是用到flink定时任务还是啥？

展开全部

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

如何在 PyFlink 1.10 中自定义 Python UDF？

基于Flink的实时日志分析系统实践

深入了解 Flink 网络栈（二）：监控、指标和处理背压

Flink: 实时规则引擎助力新零售发展

Flink: 快速构建统一的实时日志平台

Apache Flink 进阶（五）：数据类型和序列化

展开全部

还有其他疑问?