Flink CDC中datax传递参数给json配置文件的时候,能传递数组参数吗,想着把source、sink里的column列抽成外部参数,避免重复的json配置文件?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Flink CDC中使用DataX传递数组参数给JSON配置文件时,是可以的。您可以将source和sink中的column列抽成外部参数,避免重复的JSON配置文件。
下面是一个示例的JSON配置文件:
  "job": {
    "setting": {
      "speed": {
        "channel": 3
      }
    },
    "content": [
      {
        "reader": {
          "name": "mysqlreader",
          "parameter": {
            "username": "root",
            "password": "123456",
            "column": ["id", "name", "age"],  // column列作为数组参数
            "connection": [
              {
                "querySql": [
                  "select * from table1"
                ],
                "jdbcUrl": [
                  "jdbc:mysql://localhost:3306/test"
                ]
              }
            ]
          }
        },
        "writer": {
          "name": "mysqlwriter",
          "parameter": {
            "writeMode": "insert",
            "username": "root",
            "password": "123456",
            "column": ["id", "name", "age"],  // column列作为数组参数
            "connection": [
              {
                "jdbcUrl": "jdbc:mysql://localhost:3306/test",
                "table": ["table2"]  // table列作为数组参数
              }
            ]
          }
        }
      }
    ]
  }
}
在使用DataX运行任务时,可以通过命令行参数或配置文件指定参数的值。例如,通过命令行参数指定source和sink中的column列的值:
```python datax/bin/datax.py -p "-Dcolumn=['id', 'name', 'age']"
```
这样就可以实现将column列作为外部参数传递给JSON配置文件,从而避免重复的配置文件。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。