文档备案控制台

开发者社区问答正文

flink dataStream多次sink DAG重复驱动执行？

有个疑问，如下程序片段：

Properties properties = new Properties(); properties.setProperty("bootstrap.servers",kafkaAddr); properties.setProperty("group.id",kafkaOdsGroup); properties.setProperty("auto.offset.reset",kafkaOdsAutoOffsetReset);

properties.setProperty(FlinkKafkaConsumerBase.KEY_PARTITION_DISCOVERY_INTERVAL_MILLIS,kafkaOdsPartitionDiscoverInterval);

properties.setProperty("transaction.timeout.ms",KafkaOdsTransactionTimeout);//kafka事务超时时间

FlinkKafkaConsumer flinkKafkaConsumer = new FlinkKafkaConsumer<>(kafkaOdsTopic,new SimpleStringSchema(),properties); DataStreamSource dataStreamSource = env.addSource(flinkKafkaConsumer); dataStreamSource.printToErr("1"); dataStreamSource.printToErr("2"); dataStreamSource.printToErr("3");

我对一个datastream进行多次相同操作的sink，请问是否会导致上游整个DAG重复驱动执行，基于spark的惯性思维，我认为上游DAG是会重复驱动执行的？*来自志愿者整理的flink邮件归档

展开

收起

EXCEED 2021-12-01 15:41:46 1338 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

彗星halation

个人理解是不会重复驱动执行的，具体你可以测试一下，但是从底层原理上讲，我也讲不了。*来自志愿者整理的flink邮件归档

2021-12-01 16:03:29

赞同展开评论

问答分类：

消息中间件分布式计算 Kafka 流计算 Spark 实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版Sink 实时计算 Flink版驱动实时计算 Flink版datastream 实时计算 Flink版datastream sink 实时计算 Flink版dag

问答地址：

开发者社区 > 大数据 > 问答

相关问答

flink cdc整库同步mysql数据到doris，报错找不到mysql驱动包如何操作？

301

2

0

Flink Datastream作业TM日志中抛NullPointerException没有详...

129

1

0

Flink双流Join如何驱动

123

1

0

flink cdc datastream方式同步mysql数据到kafka，多分区怎么保证有序性？

157

1

0

flink cdc 3.1 读取oracle sql 读取一条就卡住了 datastream ？

130

0

0

在Flink CDC中,那你打的datastream？指标数据正常吗？

88

1

0

在Flink CDC中有没有用DataStream Source 方式 MySqlSource ？

99

1

0

对于Flink CDC，是不是加载驱动类的时候死锁导致的？

104

1

0

对于Flink CDC， datastream方式如何指定mysql的参数昂？

71

0

0

在Flink CDC中oracle-cdc使用flink-sql-client模式报这驱动如何解决？

495

8

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

notebook启动安全验证一直失败

vllm部署模型，参数如何指定

怎么在cursor上使用mcp来采集网页数据，听说brightdata-mcp适合做爬虫，好用吗？

请教一下，我4张a6000可以部署什么好点的模型

宜搭如何将流程表单的子表单中选择的人员，加入审批流程？

相关文章

别再被 Exactly-Once 忽悠了：端到端一致性到底是怎么落地的？

别再迷信离线数仓了，用流处理把实时指标平台（实时 OLAP）真正“跑起来”

“字段多一个，凌晨三点炸一次”：聊聊流数据里的 Schema 演化，到底该怎么扛

阿里云服务器内存型r9i实例性能、适用场景与2核16G、4核32G、8核64G活动价格参考

《Numba AOT编译核心技术：斩断JIT启动延迟的实操手册》

还有其他疑问?