前期准备
- 下载Pentaho(原Kettle)并解压。
a. 前往下载地址下载压缩包(例如:pdi-ce-9.3.0.0-428.zip
)。b. 解压压缩包到自定义目录。
下载MySQL驱动。
MySQL官网已不提供驱动的jar包了,因此可以使用maven下载jar包。
a. 在
pom.xml
的<dependencies>
中添加如下内容:<dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>8.0.18</version> </dependency>
驱动版本获取方法:连接RDS MySQL实例,使用
SELECT VERSION();
查看阿里云数据库的版本,然后下载对应版本的驱动。b. 在
本地镜像仓库\mysql\mysql-connector-java\8.0.18
路径下即可看到已下载的驱动jar包mysql-connector-java-8.0.18.jar
。c. 将
mysql-connector-java-8.0.18.jar
包复制到Pentaho的data-integration\lib
目录下。
通过Pentaho(原Kettle)连接RDS MySQL云数据库
- 在Pentaho的
data-integration
目录下找到spoon.bat
并运行。 - 顶部工具栏单击
文件
>新建
>作业
。 - 在
作业1
下右键DB连接
,选择新建数据库连接向导
。 - 在连接向导页面,设置
数据库连接名称
,数据库连接类型
选MySQL
,数据库访问类型
选择Native (JDBC)
,然后单击Next
。 设置
服务器主机名称
、TCP/IP端口
和数据库名称
,然后单击Next
。服务器主机名称
填写RDS实例的连接地址:- 如果Pentaho安装在与RDS同一VPC的ECS上,则用内网连接地址,如果Pentaho安装在公网机器上,则用外网连接地址。
- RDS MySQL需要添加白名单,允许Pentaho所在的机器访问。
设置
用户名
和密码
,单击测试数据库连接。用户名密码在RDS MySQL控制台创建。
- 测试连接成功后,单击
确定
。 - 单击
Finish
连接数据库。 - 在
作业1
>DB连接
的连接名上(如rds-mysql
)右键,选择SQL编辑器。 - 输入SQL语句,单击
执行
,进行测试。 - 在弹出的
预览数据
窗口即可查看可以正常使用。