前期准备
- 下载Pentaho(原Kettle)并解压。
a. 前往下载地址下载压缩包(例如:pdi-ce-9.3.0.0-428.zip)。b. 解压压缩包到自定义目录。

下载MySQL驱动。
MySQL官网已不提供驱动的jar包了,因此可以使用maven下载jar包。
a. 在
pom.xml的<dependencies>中添加如下内容:<dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>8.0.18</version> </dependency>驱动版本获取方法:连接RDS MySQL实例,使用
SELECT VERSION();查看阿里云数据库的版本,然后下载对应版本的驱动。b. 在
本地镜像仓库\mysql\mysql-connector-java\8.0.18路径下即可看到已下载的驱动jar包mysql-connector-java-8.0.18.jar。
c. 将
mysql-connector-java-8.0.18.jar包复制到Pentaho的data-integration\lib目录下。
通过Pentaho(原Kettle)连接RDS MySQL云数据库
- 在Pentaho的
data-integration目录下找到spoon.bat并运行。
- 顶部工具栏单击
文件>新建>作业。
- 在
作业1下右键DB连接,选择新建数据库连接向导。
- 在连接向导页面,设置
数据库连接名称,数据库连接类型选MySQL,数据库访问类型选择Native (JDBC),然后单击Next。
设置
服务器主机名称、TCP/IP端口和数据库名称,然后单击Next。
服务器主机名称填写RDS实例的连接地址:
- 如果Pentaho安装在与RDS同一VPC的ECS上,则用内网连接地址,如果Pentaho安装在公网机器上,则用外网连接地址。
- RDS MySQL需要添加白名单,允许Pentaho所在的机器访问。
设置
用户名和密码,单击测试数据库连接。用户名密码在RDS MySQL控制台创建。

- 测试连接成功后,单击
确定。
- 单击
Finish连接数据库。 - 在
作业1>DB连接的连接名上(如rds-mysql)右键,选择SQL编辑器。
- 输入SQL语句,单击
执行,进行测试。
- 在弹出的
预览数据窗口即可查看可以正常使用。