开发者社区大数据与机器学习实时计算 Flink 正文

执行了一个 insert，执行了一个自定义的sink 提交到yarn会生成俩job 有办法合成一

执行了一个 insert，执行了一个自定义的sink 提交到yarn会生成俩job 有办法合成一个吗大佬们 954问.png 954问问.png

展开

收起

游客3oewgrzrf6o5c 2022-07-05 13:51:21 458 版权

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，可以尝试使用 Apache Flink 的 StreamExecutionEnvironment 来实现数据流的合并，具体步骤如下：
1. 创建一个 StreamExecutionEnvironment 对象，并指定运行环境为 Yarn。
2. 使用 addSource 方法读取阿里云的数据源，将数据流转换为 DataStream 对象。
3. 使用 addSink 方法将数据流写入自定义的 Sink。
4. 调用 execute 方法启动任务。
示例代码：
```
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.setRuntimeMode(RuntimeExecutionMode.YARN); // 设置运行环境为 Yarn

DataStream<Row> sourceStream = env.addSource(...); // 读取阿里云数据源

sourceStream.addSink(...); // 写入自定义 Sink

env.execute("Job Name"); // 启动任务
```
这样做的好处是可以将两次提交合并成一个任务，提高执行效率。
2023-08-22 17:12:26

赞同展开评论

问答分类：

资源调度实时计算 Flink版

问答标签：

Yarn job Yarn办法 Yarn提交

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

请教一下，flink on yarn模式下，怎么对job作业进行指标监控？

522

flink on yarn打包运行，使用per job运行就没有问题，为什么？

flink cdc 3.0 能提交到yarn per job模式吗？

213

Flink中yarn per job配置zookeeper高可用无效是什么原因啊？

217

Flink 1.18是否不再支持Java 1.8，并且yarn也不再支持per job？

506

有人知道flink on yarn 的application模式怎么提交多个job组成应用程序呢？

237

有大佬flink on yarn用rest api提交任务吗？想问下有办法去修改提交的模式吗？

625

stand alone模式可以正常启动，yarn perjob 模式下，flink job 一直初始

358

使用 yarn-per-job 模式提交 cdc sql 后 yarn状态显示accepted？但

698

请教一下，flink如何在flink-conf文件中配置往yarn上提交的用户

867

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199212

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

实时计算系列-----第一话：前言

Flink Agents：基于Apache Flink的事件驱动AI智能体框架

【锂离子电池容量估算】电池单元总容量的递归近似加权总最小二乘估计（Matlab代码实现）

大语言模型的核心算法——简要解析

Transformer架构的简要解析

执行了一个 insert，执行了一个自定义的sink 提交到yarn会生成俩job 有办法合成一

实时计算 Flink

相关文章

热门讨论

热门文章