Datax及Datax-web 下载使用

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: Datax及Datax-web 下载使用

datax

datax 需要python2.+ 版本,一般centos自带。

如果是python3,会造成报错

1、进入目录,下载datax

cd /opt/software
wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

2、解压

tar -zxvf datax.tar.gz -C /opt/module

3、设置

vim /opt/module/datax/conf/core.json

将第28行改为 2000000,表示单个channel的大小改为2MB:


4、测试

cd /opt/module/datax
bin/datax.py job/job.json

但是会报错

2022-08-01 15:07:26.051 [main] WARN  ConfigParser - 插件[streamreader,streamwriter]加载失败,1s后重试... Exception:Code:[Common-00], Describe:[您提供的配置文件存在错误信息,请检查您的作业配置 .] - 配置信息错误,您提供的配置文件[/opt/module/datax/plugin/reader/._drdsreader/plugin.json]不存在. 请检查您的配置文件. 
2022-08-01 15:07:27.064 [main] ERROR Engine - 
经DataX智能分析,该任务最可能的错误原因是:
com.alibaba.datax.common.exception.DataXException: Code:[Common-00], Describe:[您提供的配置文件存在错误信息,请检查您的作业配置 .] - 配置信息错误,您提供的配置文件[/opt/module/datax/plugin/reader/._drdsreader/plugin.json]不存在. 请检查您的配置文件.
        at com.alibaba.datax.common.exception.DataXException.asDataXException(DataXException.java:26)
        at com.alibaba.datax.common.util.Configuration.from(Configuration.java:95)
        at com.alibaba.datax.core.util.ConfigParser.parseOnePluginConfig(ConfigParser.java:153)
        at com.alibaba.datax.core.util.ConfigParser.parsePluginConfig(ConfigParser.java:125)
        at com.alibaba.datax.core.util.ConfigParser.parse(ConfigParser.java:63)
        at com.alibaba.datax.core.Engine.entry(Engine.java:137)
        at com.alibaba.datax.core.Engine.main(Engine.java:204)

怎么处理呢,执行以下命令

cd /opt/module/datax/plugin/reader
rm -rf  ./._*
cd /opt/module/datax/plugin/writer
rm -rf  ./._*

再次启动

cd /opt/module/datax
bin/datax.py job/job.json

看到以下界面 代表执行成功

datax连接mysql8

默认的datax连接mysql驱动为5,所以当需要连接mysql8的时候会报错

可以通过下载源码,修改mysql驱动包版本

可以参考:https://blog.csdn.net/Carson073/article/details/126037927

源码下载地址:https://github.com/alibaba/DataX

当然在源码编译过程中会出现各种少包情况,需要自行百度手动下载,也可以联系我提供jar包


最省事的就是使用现成编译好的mysql包,替换即可

链接: https://pan.baidu.com/s/1Uj15QriC9rilySKNUkEguw 提取码: q6uc

下载下来之后,删除原本的插件,然后解压到对应目录就可以了

datax-web

源码地址:https://github.com/WeiYe-Jing/datax-web

https://github.com/WeiYe-Jing/datax-web/blob/master/doc/datax-web/datax-web-deploy.md

下载完成后进行解压

tar -zxvf datax-web-2.1.2.tar.gz -C /opt/module

进入解压后的目录,找到bin目录下面的install.sh文件,如果选择交互式的安装,则直接执行

./bin/install.sh

前面选yes,根据提示录入数据库信息,自动初始化数据库脚本

配置datax-web

在项目目录下/modules/datax-execute/bin/env.properties 指定PYTHON_PATH的路径

# 进入到安装目录
cd /opt/module/datax/data-web-2.1.2
# 编辑配置
vim modules/datax-executor/bin/env.properties
### 执行datax的python脚本地址
PYTHON_PATH=/opt/datax/datax/bin/datax.py

启动服务

cd /opt/module/datax/data-web-2.1.2
./bin/start-all.sh


访问(换成自己的ip地址) http://q1:9527/index.html

账号admin 密码123456

运行日志

部署完成之后,在modules/对应的项目/data/applogs下(用户也可以自己指定日志,修改application.yml中的logpath地址即可),用户可以根据此日志跟踪项目实际启动情况。


如果执行器启动比admin快,执行器会连接失败,日志报"拒绝连接"的错误,一般是先启动admin,再启动executor,30秒之后会重连,如果成功请忽略这个异常。

相关文章
QGS
|
7月前
|
前端开发 easyexcel Java
手拉手EasyExcel实现web上传下载(全栈)
EasyExcel实现web上传下载
QGS
285 2
|
关系型数据库 MySQL 调度
DataX教程(05)- DataX Web项目实践
DataX教程(05)- DataX Web项目实践
1382 0
|
7月前
|
缓存 前端开发 Java
15:Servlet 3.0文件上传与下载-Java Web
15:Servlet 3.0文件上传与下载-Java Web
196 5
|
7月前
datax-web修改web端口号
datax-web修改web端口号
520 4
|
7月前
|
关系型数据库 MySQL 分布式数据库
DataX下载安装
DataX下载安装
482 0
|
XML Java 应用服务中间件
【Java】Web应用的文件上传下载
客户端向服务器发送HTTP POST请求,其中包含要上传的文件数据。通常,这是通过HTML表单提交实现的。 Tomcat服务器接收到该请求并将其路由到对应的Servlet。 Servlet通过使用Apache Commons FileUpload库或Java Servlet API提供的multipart/form-data解析器来处理文件上传请求。
|
Java 关系型数据库 MySQL
windows部署DataX及运行dataX_WEB
windows部署DataX及运行dataX_WEB
2937 0
windows部署DataX及运行dataX_WEB
|
Web App开发 弹性计算 Android开发
阿里云无影云桌面客户端下载Win/Mac/iOS/安卓/Web端均支持
阿里云无影客户端下载系统Win/Mac/iOS/安卓/Web端均支持
4676 0
阿里云无影云桌面客户端下载Win/Mac/iOS/安卓/Web端均支持
|
Web App开发 弹性计算 Android开发
阿里云无影客户端下载Windows/Mac/iOS/安卓/Web端操作系统均支持
阿里云无影云桌面客户端下载,无影客户端支持操作系统包括Windows、Mac、Web网页端、iOS客户端和安卓客户端
阿里云无影客户端下载Windows/Mac/iOS/安卓/Web端操作系统均支持
|
小程序 IDE 开发工具
【微信小程序】微信Web开发者工具下载及安装
小程序是一种不需要下载安装即可使用的应用,它实现了应用“触手可及”的梦想,用户扫一扫或者搜一下即可打开应用。也体现了“用完即走”的理念,用户不用关心是否安装太多应用的问题。应用将无处不在,随时可用,但又无须安装卸载。

热门文章

最新文章

下一篇
DataWorks