备案控制台

开发者社区问答正文

kafka分区数扩容对flink任务有什么影响吗？

如题，flink任务当前从我了解来看，是直接先查询所有分区信息，然后assign方式指定分区消费的。包括，之前多个任务使用相同group.id消费相同topic并不会相互影响，也是这个原因，因为是通过assign方式消费，而不是分组订阅方式。

当然相关的还有一个分区发现机制（我是开启的）。

在这种情况下，我想知道topic的分区扩容之后，flink能立即感知到分区多了吗？如果不能，我猜测会导致丢失数据，因为等发现新分区的时候，会默认使用kafka配置的latest方式消费。不清楚我的猜测对不对，看看有没有人清楚，解答下，这俩天计划做分区扩容了，不清楚是否需要提前停flink任务。

*来自志愿者整理的flink邮件归档

展开

收起

游客sadna6pkvqnz6 2021-12-07 17:20:00 1927 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨

1 无状态启动情况下：（1）首先flink采用的是assign方式，非subscribe方式。（2）指定offset消费：未指定offset的分区会默认使用group offset消费。（3）指定timestamp消费：未查询到offset的分区会默认使用latest消费。（4）指定latest消费/指定earliest消费/指定group offset消费：这几种没啥好说的，按照对应策略消费即可。

2 有状态启动情况下：（1）对于存在状态的部分，按照状态中offset继续消费。（2）对于不存在于状态的部分分区，比如新增的分区，默认按照earliest消费。

3 非启动情况，任务运行中新增分区情况：新增分区按照earliest offset消费，见AbstractFetcher.addDiscoveredPartitions方法。*来自志愿者整理的flink

2021-12-07 20:38:20

赞同展开评论

问答分类：

消息中间件 Kafka 流计算实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版kafka 云消息队列 Kafka 版分区实时计算 Flink版任务云消息队列 Kafka 版flink 云消息队列 Kafka 版扩容

问答地址：

开发者社区 > 微服务 > 问答

相关问答

消息队列Kafka版扩容报错ip not enough

110

1

0

flink cdc datastream方式同步mysql数据到kafka，多分区怎么保证有序性？

132

1

0

DataWorks中odps+flink数据同步，odps在数据地图上已经能看到分区了？

120

0

0

在Flink CDC中如下是这个参数控制保留hive 多久的分区吗？

101

0

0

在Flink CDC中这种配置，会自动删除超过30天前的hive分区吗？

92

0

0

在Flink CDC中MySQL整库同步，Kafka Pipeline 不支持指定分区吗？

121

1

0

Flink这个normal 模式，怎么没有办法设置分区？

66

1

0

消息队列Kafka版Topic分区数可以减少吗

135

1

0

消息队列Kafka版分区数为什么建议是2的倍数

97

1

0

Flink api 怎么读取holo 的分区表？目前看加了分区后数据进不来

121

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云短信服务工程师连我方发送记录只会收阿里云错误码都不知道吗？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

我就想把本地的 vm 虚拟机迁移到 ECS，整的这些文档又臭又长，有这精力你录个视频不行吗？

为什么现在连qwen3-coder 之类的模型都不能选了，就一个智能回答？

biz.util.invokeWorkbench这个api打开窗口方式变了

相关文章

Linux环境下 java程序提交spark任务到Yarn报错

云原生进化论：加速构建 AI 应用

【JUC】（3）常见的设计模式概念分析与多把锁使用场景！！理解线程状态转换条件！带你深入JUC！！文章全程笔记干货！！

实时库存同步接口技术详解

如何设计10亿用户级的微博Feed流系统并应对100W QPS的挑战？

还有其他疑问?