开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC与上传作业jar包到flink执行，两者在执行任务上会有区别吗？

Flink CDC代码中使用ClusterClient.submitJob，与上传作业jar包到flink执行，两者在执行任务上会有区别吗？
一直在用这个connector-kafka版本

展开

收起

真的很搞笑 2023-12-01 10:39:28 247 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

sunrr
在Flink CDC代码中使用ClusterClient.submitJob与上传作业jar包到Flink执行，两者在执行任务上有一些区别：
1. 环境配置：使用ClusterClient.submitJob时，Flink集群的环境配置（如Flink版本、JVM参数等）需要在提交作业之前就设置好。而上传作业jar包到Flink执行时，Flink集群的环境配置可以在提交作业时通过API进行设置。
2. 资源管理：使用ClusterClient.submitJob时，Flink集群的资源管理（如内存、CPU等）需要在提交作业之前就设置好。而上传作业jar包到Flink执行时，Flink集群的资源管理可以在提交作业时通过API进行设置。
3. 依赖管理：使用ClusterClient.submitJob时，需要将作业所需的所有依赖（包括Flink相关依赖和自定义依赖）打包成一个jar文件，然后上传到Flink集群。而上传作业jar包到Flink执行时，Flink集群会自动下载并加载所需的依赖。
4. 作业生命周期管理：使用ClusterClient.submitJob时，可以通过ClusterClient对作业的生命周期进行管理，如查询作业状态、取消作业等。而上传作业jar包到Flink执行时，可以通过Flink API对作业的生命周期进行管理。
5. 容错性：使用ClusterClient.submitJob时，如果Flink集群出现故障，可以通过ClusterClient对作业进行重启或恢复。而上传作业jar包到Flink执行时，如果Flink集群出现故障，可能需要手动干预来恢复作业。
2023-12-02 16:16:03

赞同展开评论
芯在这

另外你是sql的话，你的kafka的包不对，用非工，这个包可以发我一份不，flink-sql-connect or-kafka-1.17.1.jar
https://repo.maven.apache.org/maven2/org/apache/flink/flink-sql-connector-kafka/1.17.1/flink-sql-connector-kafka-1.17.1.jar，此回答整理自钉群“Flink CDC 社区”

2023-12-01 11:25:04

赞同展开评论

问答分类：

流计算 Java 实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版任务实时计算 Flink版cdc任务实时计算 Flink版作业实时计算 Flink版区别

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink cdc source connector 分为普通cdc版本和sql版本有什么区别？

427

2

0

flink有jar包了，为什么还报错呢

271

1

0

flink作为source jar作业代码里面消费位点的订阅方式和控制台的有无状态启动有冲突吗？

208

1

0

Flink的jar作业checkpoint需要作业中开启么？还是提交后自动开启

181

1

0

DataWorks有个shell 调 jar 包的任务A，正常会 3 点启动，1.5h 结束？

186

1

0

fink yarn-application 模式不能跑 sql作业么？只能提交jar？

263

2

0

Flink的 jar作业如果里面用了state 最终是保存在内存还是外部存储？

418

1

0

Flink有个jar作业用的是异步io 但是现在都堵住那里了，怎么解决？

154

1

0

在Flink CDC中，要看项目用的是flink-cdc哪个jar包？

209

1

0

在Flink CDC中，这两个配置文件有啥区别啊?

206

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Go三目运算符之争：加还是不加？

阿里云AI安全护栏对接使用完全指南：从开通到生产级集成

使用 kkRepo 搭建 Maven 私服

【网站制作工具】怎么用BBWEYY+通义灵码制作一个韩华集团 Hanwha Group 官网

【网站搭建流程】怎么用BBWEYY+通义灵码制作一个HD 现代集团 HD Hyundai 官网

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flinkcdc在IDEA运行正常，打包就报错

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

如何用实时数据同步打破企业数据孤岛？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

Flink CDC2.4.1的版本sqlserver支持指定时间戳消费了吗？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

展开全部

还有其他疑问?