备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

kafka的partition是不是应该和slot一一对应？我的一个和window有关的应用在slo

kafka的partition是不是应该和slot一一对应？我的一个和window有关的应用在slot数目不等于partition的时候会不出结果，另一个单纯读写的应用使用一个slot消费全部partition是可以的。您聊不了解这里面的机制？本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。点击这里欢迎加入感兴趣的技术领域群。

展开

收起

黄一刀 2019-12-11 14:46:24 2302 0

1 条回答

写回答

取消提交回答

黄二刀

这个问题比较宽泛，涉及到的内容太多了，我只了解一点，所以从简单来回答，如果不对，还请见谅 1、slot： flink 的 task manager 组件可以配置多个slot（多个算子的job，如果都 chain 在一起，就可以在一个 TM 的一个 slot 里面执行，如果有keyby或者parallesm 不同的时候，前后的算子就不能在同一个 slot 里面执行，但是可以在一个 TM 里面，比如一个 TM 配置两个 slot，就可以），简单可以认为 TM 是一个进程，多个 slot 是里面的不同线程，同一个线程里面的算子，数据可以直传，不同线程就需要通信了 2、kafka 的 partition：严格来说是和 slot 没有关系的，但是 flink 在读 kafka 的时候默认是这样的： source 的最大并行度不能大于 kafka 的分区数（多也只是多得部分拿不到数据，出于吞吐量和性能的考虑，一般是建议 source 的并行度和 kafka 的分区数一致，这样每个并发可以读一个分区，效率比较高，但是数据少的时候一个并发读100个分区都没关系）；这里还有一点额外的内容就是，flink 最大并发数等于最小 slot 数，因为同一个算子的不同并发，是不可以在同一个slot 里面的（也可能算子比较多，TM 的 slot 用完了，需要多开 TM的情况，所有是等于最小 slot ）

一个和window有关的应用在slot数目不等于partition的时候会不出结果：这个应该是理解有点问题，可以详细下问题另一个单纯读写的应用使用一个slot消费全部partition是可以的：这个上面有，其实是 source 的并行度和 partition的问题，两边的个数其实是不影响程序结果的，只是表现不同，source 多就会有部分没有数据，partition多就会有一个source 的并行读多个 partiton

2019-12-11 14:46:52

赞同展开评论打赏

问答分类：

消息中间件 Kafka 开发者实时计算 Flink版云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版应用云消息队列 Kafka 版partition 云消息队列 Kafka 版slot 云消息队列 Kafka 版window

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

Kafka主要应用于哪些场景？

86

1

0

DTS是否支持将RDS MySQL表非主键字段作为Partition Key迁移到Kafka

37

1

0

Serverless应用引擎如何读取kafka消息

25

1

0

Kafka主要有哪些应用的场景？详细说说

27

1

0

Kafka中的分区（Partition）有什么作用？

33

1

0

Serverless 应用引擎 kafka 怎么触发？

34

1

0

Kafka的partition如何分布和复制？

26

1

0

Kafka中的partition是如何存储在broker上的？

42

1

0

Kafka中producer生产的数据是如何存储在partition中的？

41

1

0

Kafka中的topic和partition分别是什么概念？

47

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？

Caused by: org.apache.kafka.common.errors.TimeoutE

flink1.20.0 部署后发布报错，是怎么回事，各种配置都配置了

大佬，Caused by: java.lang.ClassNotFoundException: or

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

请问flink-connector-jdbc在sink时，如何设置批量写入？

Flink的tmp的这个目录产生临时文件很大，我想配置到外面，有配置项可以配置吗？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink CDC 能适配达梦不？

展开全部

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

Flink: 实时规则引擎助力新零售发展

【阿里内部应用】利用blink CEP实现流计算中的超时统计问题

如何分析及处理 Flink 反压？

首发｜《Apache Flink 年度最佳实践》，揭秘一线大厂实时平台构建实践

实时计算Flink云原生版本正式发布

Flink 1.10 和 Hive 3.0 性能对比（附 Demo 演示 PPT）

一文带你了解 Flink Forward 柏林站全部重点内容

展开全部

相关课程

更多

消息队列Kafka入门课程

3468

4

去学习

分布式消息系统 Kafka 快速入门

958

24

去学习

相关电子书

更多

Java Spring Boot开发实战系列课程【第16讲】：Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载

MaxCompute技术公开课第四季之如何将Kafka数据同步至MaxCompute 立即下载

消息队列kafka介绍 立即下载