未来规划中,将基于 Flink 的流处理能力,结合其批处理功能,打造流批一体的数据计算平台。这将使得数据在平台内既可以按照流式处理实时数据,也可以按照批处理模式处理历史数据,实现数据处理的统一和高效。
基于Flink构建流批一体的实时数仓是目前数据仓库领域比较火的实践方案。随着Flink的不断迭代,其提供的一系列技术特性使得用户构建流批一体的应用变得越来越方便。本文将以Flink1.12为例,一一介绍这些特性的基本使用方式,主要包括以下内容:
Flink集成Hive
Hive Catalog与Hive Dialect
Flink读写Hive
Flink upsert-kafka连接器
Flink CDC的connector
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。