开发者社区> 问答> 正文

不能实时读取实时写入到 Hive 的数据

试验了一下 Flink-1.11 hive streaming 的功能

https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/table/hive/hive_streaming.html

创建 kafka 表,通过 SQL 实时写入 Hive.

但我再通过 flink sql-client 客户端 select * from hive_table 客户端没有任何返回,通过 flink webUI 页面观察 这个 select * from hive_table 的 job 已经结束了。

*来自志愿者整理的flink邮件归档

展开
收起
小阿矿 2021-12-06 15:47:37 955 0
1 条回答
写回答
取消 提交回答
  • 你开启了 streaming-source.enable 吗?这个参数用于指定如何读取是batch读,还是stream读,如果你要实时读的话应该把这个值设定为true, 可以使用tablehints 方便地指定参数。

    SELECT * FROM hive_table /*+ OPTIONS('streaming-source.enable'='true', 'streaming-source.consume-start-offset'='2020-05-20') */;

    就在你看得这个页面应该有对应的文档说明如何读取hive数据。*来自志愿者整理的flink邮件归档

    2021-12-06 18:36:13
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载
Hive Bucketing in Apache Spark 立即下载
Comparison of Spark SQL with Hive 立即下载