备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

请问我Flink配置了按时间戳获取kafka的数据，但是，时间对不上，比如我配置的时间戳是?

'scan.startup.mode' = 'timestamp'
scan.startup.timestamp-millis 请问我Flink配置了按时间戳获取kafka的数据，但是，时间对不上，比如我配置的时间戳是16：55：00的数据，但是print的时候，还是能打印kafka元数据timestamp比这个更早的数据？

我用的flink1.13.6

展开

收起

真的很搞笑 2023-08-13 10:55:30 1076 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

在 Flink 中，使用 scan.startup.mode 和 scan.startup.timestamp-millis 配置项可以指定 Kafka 消费者从哪个时间戳开始读取数据。但需要注意的是，这些配置项只是定义了起始位置，而不会影响 Kafka 消费者读取的实际数据。

当 Flink 从 Kafka 中读取数据时，Kafka 会返回消息的偏移量（offset）和时间戳（timestamp）。Flink 在接收到数据后，会根据时间戳对数据进行处理，并将满足条件的数据打印出来。

如果您配置了 scan.startup.mode 为 timestamp，并指定了 scan.startup.timestamp-millis 为 16:55:00 的时间戳，那么 Flink 会从该时间戳开始读取数据，但并不保证只读取该时间戳之后的数据。

原因是 Kafka 的消息是按照分区存储的，而每个分区的消息又按照顺序存储。当 Flink 消费者启动时，它会根据配置的起始位置（时间戳）确定每个分区应该从哪个偏移量开始读取数据。然而，如果 Kafka 中的消息顺序不是按照时间戳排序的，那么消费者可能会读取到早于指定时间戳的消息。

2023-08-13 22:05:40

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版kafka 实时计算 Flink版数据云消息队列 Kafka 版数据实时计算 Flink版配置

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink读kafka，从某个时间戳读，配置不生效

474

2

0

Flink CDC消费kafka，入库到doris，会把kafka的元数据时间戳存到doris？

443

1

0

请问Flink我配置了按时间戳获取kafka的数据，但是，时间对不上，比如我配置的时间戳是？

467

1

0

DataWorks中kafka实时同步到holo，可以设置指定启动位点时间戳吗？

192

3

0

请教个问题 Flink中同一套代码本地指定时间戳消费kafka没有问题，集群消费kafka只能从最？

171

1

0

有谁碰到flinksql读取kafka时间戳元数据的时候显示的时间日期为1970-01-01 的吗？

356

2

0

实时同步kafka 的时间戳必须是13位的才能识别到位点吗？

466

10

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2129

1

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

1989

3

0

flink1.13.5 mysql-cdc-2.2.0 mysql 5.6 一次同步90w数据后不同

392

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

强一致性时代，Kafka、Redis、Celery 谁才是那块短板

Delta Join：为超大规模流处理实现计算与历史数据解耦

淘宝京东拼多多API：电商供应链优化的关键钥匙

到底该选谁？Hadoop、Spark、Flink、云大数据的“江湖全景图”

阿里云mqtt服务器多少钱？云消息队列MQTT收费价格整理

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

在斗鱼，实时计算发展的历程如何？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

如何用实时数据同步打破企业数据孤岛？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

请问下大家有没有遇到过这个错:Caused by: java.lang.ClassNotFoundE

flink sql 批模式需要咋配置啊？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

基于实时计算（Flink）打造一个简单的实时推荐系统

广告场景下的实时计算

展开全部

还有其他疑问?