环境准备
- Linux 操作系统
- JDK(1.8 及其以上都可以,推荐 1.8)
- Python(2 或者 3 都可以)
- Apache Maven 3.X(源码编译安装需要)
二进制安装
下载安装包
下载 DataX 的工具包,下载地址:https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz
上传安装包
将下载好的安装包上传至 Linux 系统的 /opt
目录下。
解压安装包
tar -zxvf datax.tar.gz
验证安装
进入 bin 目录,即可运行同步作业:
cd {YOUR_DATAX_HOME}/bin python datax.py {YOUR_JOB.json}
执行自检脚本:
python3 bin/datax.py job/job.json
源码编译安装
环境准备
源码编译需要安装 Maven 3.X 环境。
下载源码
下载 DataX 源码:git clone git@github.com:alibaba/DataX.git
。
Maven 打包
cd {DataX_source_code_home} mvn -U clean package assembly:assembly -Dmaven.test.skip=true
打包成功,日志显示如下:
[INFO] BUILD SUCCESS [INFO] ----------------------------------------------------------------- [INFO] Total time: 08:12 min [INFO] Finished at: 2015-12-13T16:26:48+08:00 [INFO] Final Memory: 133M/960M [INFO] -----------------------------------------------------------------
打包成功后的 DataX 包位于 {DataX_source_code_home}/target/datax/datax/
,结构如下:
cd {DataX_source_code_home} ls ./target/datax/datax/ bin conf job lib log log_perf plugin script tmp
验证安装
验证部署和上述二进制安装方式相同。