备案控制台

开发者社区问答正文

flink sql 不同job消费同一个kafka表(指定了groupId)时输出相同数据？

Hi,all 使用flink版本1.10.0，在hive catalog下建了映射kafka的表: CREATE TABLE x.log.yanfa_log ( dt TIMESTAMP(3), conn_id STRING, sequence STRING, trace_id STRING, span_info STRING, service_id STRING, msg_id STRING, servicename STRING, ret_code STRING, duration STRING, req_body MAP<String,String>, res_body MAP<STRING,STRING>, extra_info MAP<STRING,STRING>, WATERMARK FOR dt AS dt - INTERVAL '60' SECOND ) WITH ( 'connector.type' = 'kafka', 'connector.version' = '0.11', 'connector.topic' = 'x-log-yanfa_log', 'connector.properties.bootstrap.servers' = '******:9092', 'connector.properties.zookeeper.connect' = '******:2181', 'connector.properties.group.id' = 'testGroup', 'connector.startup-mode' = 'group-offsets', 'update-mode' = 'append', 'format.type' = 'json', 'format.fail-on-missing-field' = 'true' ); 消费表x.log.yanfa_log程序如下： Catalog myCatalog = new HiveCatalog("x", "default", "D:\conf", "1.1.0"); tEnv.registerCatalog("x", myCatalog); Table rs = tEnv.sqlQuery("select * from x.log.yanfa_log"); tEnv.toAppendStream(rs, Row.class).print();

然后针对同一个程序启动了2个job，结果都输出了相同的结果。我的疑问是kafka topic的同一个partition不是只能被group下至多一个consumer消费吗？为什么2个job会输出相同结果呢？

来自志愿者整理的flink邮件归档来自志愿者整理的FLINK邮件归档

展开

收起

小阿怪 2021-12-04 19:26:04 1906 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

Flink的Kafka Connector的实现是用的Kafka lower api，也就是会自己去获取当前的partition信息，自己来分配那些subtask读取那个partition。所以如果有两个任务，他们互相之间是没有关系的，也不会相互感知到。（只有一点，就是如果你配置了相同的group id，他们提交offset可能会互相覆盖。）你说的那个模式是Kafka high-level api。

来自志愿者整理的flink邮件归档来自志愿者整理的FLINK邮件归档

2021-12-04 22:34:59

赞同展开评论

问答分类：

消息中间件 SQL Kafka HIVE 流计算云消息队列 Kafka 版实时计算 Flink版微服务引擎

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版kafka 实时计算 Flink版SQL SQL数据 flink SQL

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink CDC里为什么官网给的这个groupid我在maven仓库中没有找到所属组？

169

0

0

Flink的kafka的groupid是需要提前创建呢还是说只是一个标识，用来区分是哪个消费者？

768

1

0

请问下，flink sql 创建后，源库删除，目标不删除，这个操作有好的解决方法没呀？

1985

3

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2146

1

0

flink sql 可不可以实现过滤某种操作事件

2357

7

0

有大佬知道这是怎么回事么 flink读不到kafka数据

1340

1

0

请问下当flink集群重启之后 kafka消息还是重复有什么办法解决吗 kafka sink 已设

1289

4

0

麻烦问一下，我们现在的架构是希望数据统一从 Kafka 中出，但是又想用 Flink CDC，请问

1136

1

0

各位, 请问: flink cdc, 用 flink sql 的方式 sink 到 kafka 可以

1462

2

0

flink cdc内置了kafka 监听binlog文件的时候是把所有监听的数据写入kafka的

1670

4

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

notebook启动安全验证一直失败

vllm部署模型，参数如何指定

请教一下，我4张a6000可以部署什么好点的模型

宜搭如何将流程表单的子表单中选择的人员，加入审批流程？

通义灵码的idea插件，在Mac系统下，idea版本2025.3.1，idea打开通义灵码插件花屏

相关文章

Java学习路径26

Java学习路径

2 核16G云服务器多少钱？2026年阿里云 2 核 16G 云服务器：价格、性能与适用场景解析

流式聚合不慢才怪？窗口、触发器和内存这三板斧你真用对了吗

云数据库多少钱？2026年阿里云数据库 RDS 收费标准：MySQL、SQL Server 等引擎价格解析

还有其他疑问?