备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

请教个问题： flink实时读取 hbase（hbase数据实时更新），整个任务只读取一次（flin

请教个问题： flink实时读取 hbase（hbase数据实时更新），整个任务只读取一次（flink sql 自定义hbase源，只能跑一次）。这个问题怎么解决？让任务可以持续地跑场景：每20分钟，读取hbase全量数据（60min过期）做聚合统计（hbase的数据实时更新）这个Hbase实际是实时更新的，但 received数据为 0 。不像kafka一样，实时有received数据 1616问.png

展开

收起

游客3oewgrzrf6o5c 2022-07-15 16:23:53 1287 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

叶秋学长

全栈JAVA领域创作者

这个问题可能是由于 Flink 的任务只读取了一次数据造成的。如果您的任务只读取了一次数据，任务就无法获取后续更新的数据，因此任务就无法正确地处理实时更新的数据。
您可以尝试以下方法来解决这个问题：

使用 Flink 的流数据处理模型。如果您的任务需要处理实时流数据，您可以使用 Flink 的流数据处理模型。这个模型可以让任务实时地处理流数据，从而使任务能够获取后续更新的数据。
使用 Flink 的延迟数据处理模型。如果您的任务需要处理延迟数据，您可以使用 Flink 的延迟数据处理模型。这个模型可以让任务处理延迟数据，从而使任务能够获取后续更新的数据。
使用 Flink 的事件时间处理模型。如果您的任务需要处理事件时间数据，您可以使用 Flink 的事件时间处理模型。这个模型可以让任务处理事件时间数据，从而使任务能够获取后续更新的数据。
使用 Flink 的批处理模型。如果您的任务需要处理批处理数据，您可以使用 Flink 的批处理模型。这个模型可以让任务处理批处理数据，从而使任务能够获取后续更新的数据。
需要注意的是，使用 Flink 的流数据处理模型、延迟数据处理模型、事件时间处理模型或者批处理模型可能会增加任务的开销和延迟。因此，您需要根据实际情况来决定是否使用这些模型。如果您对这些方法感兴趣，请查看 Flink 的官方文档。

2023-07-31 07:59:40

赞同展开评论

问答分类：

分布式数据库流计算 Hbase 实时计算 Flink版云数据库HBase版云消息队列 Kafka 版

问答标签：

实时计算 Flink版任务实时计算 Flink版数据云数据库HBase版数据实时计算 Flink版数据任务实时计算 Flink版hbase

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink 1.18 以上的 flink-connector-hbase连接包那里可以有？

163

1

0

JindoFS如何支持HBase、Flink等分布式系统？

168

1

0

Flink hbase短路读取datanode报错怎么办？

185

2

0

Flink关联hbase维表时源表可以用view吗

75

0

0

Flink CDC里有用过cdc+doris实时更新，增删改的业务场景吗？

88

1

0

Flink为什么1.18没有这个hbase 连接包？是没开发还是不需要这个包了？

105

1

0

我们关联进行数据处理后需要实时更新维表。Flink这个维表更新怎么保证是在逻辑处理以后呢？

334

7

0

Flink HBase SQL 连接器为啥不支持数据类型？

69

0

0

现在用的2.3.0的Flink CDC，从oracle同步到hbase，不知道哪种方式好些？

165

4

0

Flink中 connector 应该指定hbase什么版本？

451

3

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199212

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

构建高效的实时数据管道：Flink、Kafka、CnosDB 的完美结合

实现千表入湖之Apache Paimon篇

OBS特效与OBS美颜一步到位：专为新手主播打造的YY开播工具集成方案

【机器人路径规划】基于流场寻路算法(Flow Field Pathfinding)的机器人路径规划（Python代码实现）

【模型预测控制MPC】使用二次规划来模拟多输入多输出(MIMO)系统的模型预测控制（Matlab代码实现）

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

请问如何用flink sql客户端用yarn application模式提交任务呢？

请问下大家有没有遇到过这个错:Caused by: java.lang.ClassNotFoundE

在斗鱼，实时计算发展的历程如何？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flink怎么能够快速消费kafka数据，需要设置什么参数呢？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

flink-CDC-3.0 mysql to doris 数据同步任务经常报错

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

flinkcdc启动，怎么修改默认端口号，默认是8081。

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

展开全部

还有其他疑问?