备案控制台

开发者社区问答正文

无法从kafka主题轮询/获取所有记录

我正在尝试从特定主题轮询数据，例如kafka正在接收100条记录/秒，但大多数情况下它不会获取所有记录。我将超时设置为5000ms，并且每次都调用此方法100ms 注意：我也订阅了特定主题

@Scheduled（fixedDelayString =“ 100”）

    public void pollRecords() {
        ConsumerRecords<String, String> records = 
        leadConsumer.poll("5000");

我如何从kafka获取所有数据？

问题来源：Stack Overflow

展开

收起

montos 2020-03-27 16:08:39 531 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

montos

从poll（）返回的最大记录数由max.poll.records消费者配置参数指定。（默认值为500）。此外，还有另一个使用者配置参数，用于限制从服务器返回的最大数据量。（fetch.max.bytes和max.partition.fetch.bytes）

另一方面，在经纪人方面，还有另一个大小限制，称为message.max.bytes。

因此，您应该正确设置这些参数以获取更多消息。

从Kafka文档（链接）：

max.poll.records：一次调用poll（）时返回的最大记录数。（预设值：500）

fetch.max.bytes：服务器应为获取请求返回的最大数据量。使用者将批量获取记录，并且如果获取的第一个非空分区中的第一个记录批次大于此值，则仍将返回记录批次以确保使用者可以取得进展。因此，这不是绝对最大值。代理接受的最大记录批处理大小是通过message.max.bytes（代理配置）或max.message.bytes（主题配置）定义的。请注意，使用者并行执行多个提取。（预设值：52428800）

message.max.bytes： Kafka允许的最大记录批处理大小。如果增加了该数量，并且有一些使用方的年龄大于0.10.2，则还必须增加使用方的获取大小，以便他们可以获取如此大的记录批次。在最新的消息格式版本中，为了提高效率，始终将记录分组。在以前的消息格式版本中，未压缩的记录不会分组，并且在这种情况下，此限制仅适用于单个记录。可以使用主题级别max.message.bytes配置对每个主题进行设置。（预设值：1000012）

max.partition.fetch.bytes：服务器将返回的每个分区的最大数据量。记录由消费者分批提取。如果提取的第一个非空分区中的第一个记录批处理大于此限制，则仍将返回该批处理以确保使用者可以取得进展。代理接受的最大记录批处理大小是通过message.max.bytes（代理配置）或max.message.bytes（主题配置）定义的。有关限制使用者请求大小的信息，请参见fetch.max.bytes。（预设值：1048576）

回答来源：Stack Overflow

2020-03-27 16:09:09

赞同展开评论

问答分类：

消息中间件 Kafka 云消息队列 Kafka 版

问答标签：

云消息队列 Kafka 版主题云消息队列 Kafka 版轮询

问答地址：

开发者社区 > 微服务 > 问答

相关问答

大佬们,flink 如何动态更新source呀?如何自由增加和减少flink读取kafka的主题创建

162

1

0

Kafka中的主题（Topic）是什么？

499

2

0

DataWorks有个实时kafka同步到hologres的任务，当前这个主题下显示消息堆积？

106

0

0

v1.1.3-alpha-3版kafka主题为多分区时，消费到的数据不完整

123

1

0

canal+kafka新建主题时，分区数为1

181

1

0

请问多个flink程序，想要消费同一个kafka消费者主题，你们是怎么解决的啊？是不是不能这样搞啊

521

1

0

Flink SQL读取Kafka数据并写入 Kafka另外一个主题，为何总是持续重启？

1156

1

0

kafka中为什么不可以将主题只设置为一个分区？

449

1

0

kafka中的主题会被分为什么？

384

1

0

kafka中的主题用什么来分类？

396

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

数据一多就卡？别急，先把“数据入口”修好

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

开箱即用的 GoWind Admin｜风行，企业级前后端一体中后台框架：深度解析 Wire 依赖注入集成实践

三大电商API应用对比：淘宝京东拼多多谁能笑到最后？

AgentScope x RocketMQ：打造企业级高可靠 A2A 智能体通信基座

还有其他疑问?