备案控制台

开发者社区问答正文

Flink中一个作业中的多个作业或多个管道

我有一个用例，我希望在Flink上运行2个独立的处理流程。所以2流看起来像

Source1 - > operator1 - > Sink1

Source2 - > operator2 - > Sink2

我想为两个流重用相同的Flink集群。我可以想到以两种方式做到这一点：

1）在同一Flink应用程序上提交2个不同的作业

2）在同一工作中设置2个管道

我能够设置第一个选项，但不知道如何做第二个选项。有人曾经尝试过这样的设置吗？一个优于另一个的优势是什么？

展开

收起

社区小助手 2018-12-11 16:16:50 4911 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。
可以在setupJob（）方法中创建多个管道（使用单独的或共享的源使用者）。这是一个例子：
private void buildPipeline(StreamExecutionEnvironment env, String sourceName, String sinkName) {
```
DataStream<T> stream = env
        .addSource(getInputs().get(sourceName))
        .name(sourceName);
stream = stream.filter(evt -> filter());
....
```
}
@Override
public void setupJob(AthenaFlinkJobConfiguration jobConfig, StreamExecutionEnvironment env) throws Exception {
```
...
buildPipeline(env, sourceTopic1, sink1, ...);
buildPipeline(env, sourceTopic2, sink2, ...);
...
```
}
这是两种方法的快速对比。使用单独工作的优点/缺点：
[+]代码更简单。
[+]更灵活地设置低级配置（容错机制，堆大小，并行性等）
[ - ]由于资源不共享，因此基础设施成本较高。
[ - ]维护和监控更复杂，更耗时。
在单个作业中使用单独管道的好处：
[+]监控和调试单个作业更容易。
[+]修补程序被提交到单个仓库并部署到单个环境中。
[+]经济：降低基础设施硬件和运营成本。
[ - ]不能绑定单个管道使用。
[ - ]一个管道中的故障会影响另一个管道。
[ - ]一个管道中的背压可能会影响整个作业，因为每个作业都会为一个检查点创建快照。
2019-07-17 23:19:51

赞同展开评论

问答分类：

测试技术流计算实时计算 Flink版

问答标签：

实时计算 Flink版作业实时计算 Flink版管道

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在Flink CDC中配置文件同步方式，没有kafka管道jar包，怎么办？

70

1

0

Flink CDC里有没有大佬试过cdc3.0.0到doris管道模式全库同步啊？

116

0

0

取消 flink 作业后，发现 flink 所在的 taskmanage 挂掉了。上面的 flin

2715

5

0

flink大作业启动频繁报akka.pattern.AskTimeoutException 大家有

1412

3

0

如果上游mysql库下的表很多，数据变化很频繁的话，会不会造成下游flink cdc作业消费binl

814

1

0

大家 flink cdc 用的是不是都是 datastream 方式? 如果sql 作业貌似

635

0

0

flink作业不是每个任务里面点进去都有各自的日志吗？

1080

5

0

我开启 flink cdc作业后为什么数据库上那么多 binlog 解析器

934

1

0

有flink的python作业的demo吗如何连接我的catalog的表如何输出呢

701

1

0

大佬们， flink的yarn-session模式是在那个服务器起的在哪个服务器提交作业吗，还是根

1023

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

相关文章

OOM排查之路：一次曲折的线上故障复盘

发布模式

重复性工作中如何培养匠心

Playwright 等待机制详解：自动与显式等待的深入分析

使用Cursor自动生成完整函数的指南

还有其他疑问?