Datax 环境搭建

简介: datax、环境搭建、数据同步

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。

环境搭建:

下载datax数据包

cd /opt/
wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

将下载好的压缩包解压

tar zxvf datax.tar.gz

删除隐藏文件

rm -rf /opt/datax/plugin/*/._*

不删除因为文件执行任务会报错

验证是否安装成功

cd /opt/datax/bin/
python datax.py ../job/job.json

问题:

底层采用select * 扫描全表方式,可能会对数据库产生较大影响,风险较高

示例脚本:oracle->hdfs

{
  "job": {
    "content": [
      {
        "reader": {
          "name": "oraclereader",
          "parameter": {
            "column": ["*"],
            "connection": [
              {
                "jdbcUrl": ["jdbc:oracle:thin:@//ip:port/database"],
                "table": ["table"]
              }
            ],
            "password": "password",
            "username": "username"
          }
        },
        "writer": {
          "name": "hdfswriter",
          "parameter": {
            "column": [
                "*"
                    ],
            "defaultFS": "hdfs://ip:port",
            "fieldDelimiter": " ",
            "fileName": "oracle.txt",
            "fileType": "text",
            "path": "path",
            "writeMode": "append"
          }
        }
      }
    ],
    "setting": {
      "speed": {
        "channel": "1"
      }
    }
  }
}


目录
相关文章
|
SQL 存储 关系型数据库
DataX - 全量数据同步工具(2)
DataX - 全量数据同步工具
|
关系型数据库 MySQL 调度
DataX教程(05)- DataX Web项目实践
DataX教程(05)- DataX Web项目实践
2727 0
|
Java Linux DataX
DataX入门指南:快速部署和安装指南
DataX入门指南:快速部署和安装指南
4060 2
DataX入门指南:快速部署和安装指南
|
调度 DataX 容器
DataX教程(07)- 图解DataX任务分配及执行流程
DataX教程(07)- 图解DataX任务分配及执行流程
1510 0
DataX教程(07)- 图解DataX任务分配及执行流程
|
Java 关系型数据库 DataX
DATAX数据同步
DATAX数据同步
3314 0
|
存储 监控 关系型数据库
DataX 概述、部署、数据同步运用示例
DataX是阿里巴巴开源的离线数据同步工具,支持多种数据源之间的高效传输。其特点是多数据源支持、可扩展性、灵活配置、高效传输、任务调度监控和活跃的开源社区支持。DataX通过Reader和Writer插件实现数据源的读取和写入,采用Framework+plugin架构。部署简单,解压即可用。示例展示了如何配置DataX同步MySQL到HDFS,并提供了速度和内存优化建议。此外,还解决了NULL值同步问题及配置文件变量传参的方法。
9176 5
|
关系型数据库 MySQL 分布式数据库
DataX下载安装
DataX下载安装
2049 0
|
SQL 关系型数据库 MySQL
DataX - 全量数据同步工具(1)
DataX - 全量数据同步工具
|
存储 SQL JSON
5、DataX(DataX简介、DataX架构原理、DataX部署、使用、同步MySQL数据到HDFS、同步HDFS数据到MySQL)(一)
5、DataX(DataX简介、DataX架构原理、DataX部署、使用、同步MySQL数据到HDFS、同步HDFS数据到MySQL)(一)