分享资源地址及文件列表:
链接:https://pan.baidu.com/s/1XVTxKLkOYrL4pCZpFfs-Tg 提取码:sq90
包含文件:
# 命令执行 gpkafka # 扩展安装 gpss.control gpss--1.0.sql # 扩展安装时依赖文件 gpss.so # GP 的 lib 文件 librdkafka.so.1
特别注意:
本文部署的Greenplum在root
用户的/usr/local/
文件夹下,而不是在gpadmin
用户下,所以产生了不少问题,实际部署时还是要将Greenplum数据库安装在非root
用户下。
1.需求说明
Kafka 是分布式消息订阅系统,有非常好的横向扩展性,可实时存储海量数据,是很常用的流数据处理中间件。物联网设备采集的数据很多时候就是通过 Kafka 进行处理的。当 Kafka 数据要入库分布式数据库 Greenplum 时,我们就需要考虑入库的效率和可靠性了。