备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

写Flink-API代码不是可以指定消费KAFKA的数据是从最新的位置、最早的位置、当前OFFSET

写Flink-API代码不是可以指定消费KAFKA的数据是从最新的位置、最早的位置、当前OFFSET三种方式进行数据读取吗？Flink-SQL 如何指定?

展开

收起

游客3oewgrzrf6o5c 2022-07-27 10:19:03 680 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

是的，使用 Flink API 可以指定从最新的位置、最早的位置或者指定的 offset 开始消费 Kafka 数据。

对于从最新位置开始消费 Kafka 数据，可以使用以下代码：

java
Copy
Properties properties = new Properties();
properties.setProperty("bootstrap.servers", "localhost:9092");
properties.setProperty("group.id", "my-group");

FlinkKafkaConsumer consumer = new FlinkKafkaConsumer<>("my-topic", new SimpleStringSchema(), properties);
consumer.setStartFromLatest();

DataStream stream = env.addSource(consumer);
这里使用 setStartFromLatest() 方法将消费者的起始位置设置为最新的位置。类似地，您也可以使用 setStartFromEarliest() 方法将起始位置设置为最早的位置，或者使用 setStartFromSpecificOffsets() 方法手动指定起始 offset。

对于 Flink SQL，您可以在创建表时使用 properties 子句指定 Kafka 消费者的相关属性，例如：

sql
Copy
CREATE TABLE kafka_table (
id INT,
name STRING
) WITH (
'connector' = 'kafka',
'topic' = 'my-topic',
'properties.bootstrap.servers' = 'localhost:9092',
'properties.group.id' = 'my-group',
'scan.startup.mode' = 'latest-offset',
'format' = 'json'
);
这里使用 'scan.startup.mode' = 'latest-offset' 将消费者的起始位置设置为最新的位置。类似地，您也可以使用 'scan.startup.mode' = 'earliest-offset' 将起始位置设置为最早的位置，或者使用 'scan.startup.mode' = 'specific-offsets' 手动指定起始 offset。

2023-07-17 13:25:09

赞同展开评论

问答分类：

消息中间件 Kafka 实时计算 Flink版云消息队列 Kafka 版

问答标签：

API数据 API代码实时计算 Flink版kafka 实时计算 Flink版数据实时计算 Flink版代码

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink代码打印的log4j日志怎么输出到sls

111

1

0

Flink CDC里flink1.18 拉的代码没有这个类，但是下载的jar包中有这个类，啥情况？

115

0

0

Flink CDC 3.0版本是否支持通过代码实现整库同步和schema变更功能？

201

1

0

这个代码flink 1.5可以调用 jars/upload上传jar包。啥情况？

278

1

0

flink作为source jar作业代码里面消费位点的订阅方式和控制台的有无状态启动有冲突吗？

104

1

0

在Flink CDC中，直接用的oracleSource去读的，是否要指定类型转换的代码？

91

1

0

在Flink CDC中，能直接获取offset信息吗？我看代码offset.storage是写死

89

0

0

对于Flink CDC，是否可以贡献tidb的source代码？

115

1

0

Flink cep代码中vvp界面显示的并行度和启动时设置的并行度不一致

108

1

0

Flink的SQL代码只能查看不能编辑

59

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

SOCKS5代理：通用性与协议覆盖

别等服务器“累瘫了”才想扩容：运维的容量规划，从监控数据说起

简单讲一下有哪些常见的设计模式？

别再“人肉运维”了——聊聊自动化运维平台怎么从0到1搭起来

批量获取淘宝商品评论：API 分页策略、并发控制与频率优化

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

请问下有实现达梦数据库的 Flink CDC么?

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

Flink的集群模式区别，有何优缺点

Flink的tmp的这个目录产生临时文件很大，我想配置到外面，有配置项可以配置吗？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Flink用jdbc catalog连接postgresql时pg的schema里有横线该怎么处理？

请问我现在需要查询出当前日期，flink sql 如何写？查询api 有一个但是不对，CURR

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?