如何将 PolarDB-X 与大数据等系统互通-阿里云开发者社区

如何将 PolarDB-X 与大数据等系统互通

2023-09-13 173

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生数据库 PolarDB 分布式版，标准版 2核8GB

云原生数据库 PolarDB PostgreSQL 版，标准版 2核4GB 50GB

云原生数据库 PolarDB MySQL 版，通用型 2核4GB 50GB

简介： 本场景带您体验如何将PolarDB-X通过Canal与ClickHouse进行互通。

如何将 PolarDB-X 与大数据等系统互通

1. 创建实验资源

开始实验之前，您需要先创建ECS实例资源。

在实验室页面，单击创建资源。
（可选）在实验室页面左侧导航栏中，单击云产品资源列表，可查看本次实验资源相关信息（例如IP地址、用户信息等）。

说明：资源创建过程需要1~3分钟。

2. 安装PolarDB-X

本步骤将指导您如何安装PolarDB-X。

安装并启动Docekr。

(1) 执行如下命令，安装Docker。

curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun

(2) 执行如下命令，启动Docker。

systemctl start docker

执行如下命令，安装PolarDB-X。

docker run -d --name some-polardb-x -p 8527:8527 polardbx/polardb-x:2.1.0

3. 登录PolarDB-X数据库

本步骤将指导您如何登录PolarDB-X数据库。

PolarDB-X支持通过MySQL Client命令行、第三方客户端以及符合MySQL交互协议的第三方程序代码进行连接。本实验场景主要介绍如何通过MySQL Client命令行连接到PolarDB-X数据库。

执行如下命令，安装MySQL。

yum install mysql -y

执行如下命令，查看MySQL版本号。

mysql -V

返回结果如下，表示您已成功安装MySQL。

执行如下命令，登录PolarDB-X数据库。

说明：

本实验场景中的PolarDB-X数据库用户名和密码已预设，请您使用下方命令登录即可。
如遇到mysql: [Warning] Using a password on the command line interface can be insecure.ERROR 2013 (HY000): Lost connection to MySQL server at 'reading initial communication packet', system error: 0报错，请您稍等一分钟，重新执行登录命令即可。

mysql -h127.0.0.1 -P8527 -upolardbx_root -p123456

返回结果如下，表示您已成功登录PolarDB-X数据库。

输入exit退出数据库。

4. 搭建实时分析系统

本步骤将指导您如何使用PolarDB-X+Canal+ClickHouse搭建实时分析系统。

部署Canal。

Canal是一款流行的MySQL Binlog增量订阅工具，详情请参见Canal说明文档。Canal提供了Docker镜像，详情请参见Canal Docker镜像文档。

(1) 执行如下命令，下载脚本。

wget https://raw.githubusercontent.com/alibaba/canal/master/docker/run.sh

(2) 执行如下命令，构建一个destination name为test的队列。

注意：您需要将none_loopback_host_ip修改为云产品资源列表中的ECS的弹性IP，请勿使用localhost或127.0.0.1。

sh run.sh -e canal.auto.scan=false \
-e canal.destinations=test \
-e canal.instance.master.address=none_loopback_host_ip:8527 \
-e canal.instance.dbUsername=polardbx_root \
-e canal.instance.dbPassword=123456 \
-e canal.instance.connectionCharset=UTF-8 \
-e canal.instance.tsdb.enable=true \
-e canal.instance.gtidon=false

部署ClickHouse。

ClickHouse是一款分析系统，详情请参见ClickHouse官方文档。ClickHouse提供了Docker镜像，详情请参见ClickHouseDocker镜像文档。

执行如下命令，部署ClickHouse。

docker run -d --name some-clickhouse-server --ulimit nofile=262144:262144 -p 8123:8123 yandex/clickhouse-server

在PolarDB-X和ClickHouse中创建测试库和表。

(1) 执行如下命令，登录PolarDB-X数据库。

mysql -h127.0.0.1 -P8527 -upolardbx_root -p123456

(2) 执行如下SQL语句，创建数据库testdb。

CREATE DATABASE testdb;

(3) 执行如下SQL语句，使用数据库testdb。

USE testdb;

(4) 执行如下SQL语句，创建test表。

CREATE TABLE test(
id INT(11) AUTO_INCREMENT PRIMARY KEY,
name CHAR(20) not null );

(5) 输入exit退出数据库。

(6) 执行如下命令，登录ClickHouse数据库。

docker run -it --rm --link some-clickhouse-server:clickhouse-server yandex/clickhouse-client --host clickhouse-server

(7) 执行如下SQL语句，创建数据库testdb。

CREATE DATABASE testdb;

(8) 执行如下SQL语句，使用数据库testdb。

USE testdb;

(9) 执行如下SQL语句，创建test表。

Create Table test(id INT(32),name CHAR(20)) Engine = MergeTree() Order By id;

(10) 输入exit退出数据库。

运行Canal Client消费并投递增量变更。

经过以上步骤，您已经准备好了PolarDB-X、Canal Server和ClickHouse三个容器，并且在源端（PolarDB-X）和目标（ClickHouse）建好了测试用的数据库和表。接下来我们通过Canal Client消费Canal Server获取的增量数据，并将源端DML中的Insert事件投递到ClickHouse中。

(1) 执行如下命令，使用yum安装JDK 1.8。

yum -y install java-1.8.0-openjdk*

(2) 执行如下命令，下载polardb-x-to-clickhouse-canal-client.jar投递代码文件。

wget https://labfileapp.oss-cn-hangzhou.aliyuncs.com/polardb-x-to-clickhouse-canal-client.jar

(3) 执行如下命令，运行polardb-x-to-clickhouse-canal-client.jar代码文件。

java -jar polardb-x-to-clickhouse-canal-client.jar

注意：请勿中断投递代码文件，否则会造成投递失败。

(4) 投递链路已成功打通，接下来您可以在源端（PolarDB-X）执行INSERT语句，并观察目标端（ClickHouse）中的数据变化。

在实验页面，单击右上角的图标，创建新的终端窗口。

(5) 在新的终端窗口中，执行如下命令，登录PolarDB-X数据库。

mysql -h127.0.0.1 -P8527 -upolardbx_root -p123456

(6) 执行如下SQL语句，使用数据库testdb。

USE testdb;

(7) 执行如下SQL语句，插入一条数据。

INSERT INTO test(name) values("polardb-x"), ("is"), ("awsome");

(8) 输入exit退出数据库。

(9) 执行如下命令，登录ClickHouse数据库。

docker run -it --rm --link some-clickhouse-server:clickhouse-server yandex/clickhouse-client --host clickhouse-server

(10) 执行如下SQL语句，使用数据库testdb。

USE testdb;

(11) 执行如下SQL语句，查询test表

SELECT * FROM test;

返回结果如下，您可以看到目标端（ClickHouse）接收到投递过来的数据。

5. 了解更多

如果您想了解更多有关PolarDB-X分布式事务实现原理，详情请参见PolarDB-X分布式事务实现原理（一）。
如果您想了解更多有关PolarDB-X全局Binlog解读，详情请参见PolarDB-X全局Binlog解读。
如果您想了解更多有关PolarDB-X全局Binlog解读之DDL，详情请参见PolarDB-X全局 Binlog解读之DDL。

实验链接：https://developer.aliyun.com/adc/scenario/a734d982339845f18baa71d3cd5a4387

如何将 PolarDB-X 与大数据等系统互通

如何将 PolarDB-X 与大数据等系统互通

PolarDB开源

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景