聊聊 datax 的 OceanBase 数据同步插件 ||批处理参数 rewriteBatchedStatements=true&useCursorFetch=true

2023-09-22 276

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

云数据库 RDS MySQL，高可用系列 2核4GB

简介： 聊聊 datax 的 OceanBase 数据同步插件分析下批处理参数 rewriteBatchedStatements=true&useCursorFetch=true 对大规模数据读写的性能影响

聊聊 datax 的 OceanBase 数据同步插件 ||批处理参数 rewriteBatchedStatements=true&useCursorFetch=true

1 背景

在信创的大背景下，不少公司选用了蚂蚁的分布式数据库 OceanBase，OceanBase 是一款开源分布式 HTAP（Hybrid Transactional/Analytical Processing）数据库管理系统，具有原生分布式架构，支持金融级高可用、透明水平扩展、分布式事务、多租户和语法兼容等企业级特性。OceanBase 内核通过大规模商用场景的考验，已服务众多行业客户，现面向未来持续构建内核技术竞争力。
在大数据场景下，不可避免地会遇到使用数据同步工具在 hdfs 和 OceanBase 之间同步数据的需求，常见的离线数据同步工具有 sqoop/datax/spark/seatunnel等。
在使用 datax 同步OceanBase数据时，我们可以使用rdbmswriter/rdbmsreader,也可以使用oceanbasev10writer/oceanbasev10reader来同步 ob数据。

近期我们在某客户现场使用datax 的 rdbmswriter/rdbmsreader 进行大批量数据同步时却遇到了 OutOfMemoryError 问题，本文针对该问题进行分析，并给出解决方案。

2 问题现象

某客户通过 datax 使用 rdbmsreader 读取 ob 数据并以 orc 格式写入到 hdfs 时，当数据量达到400w 时（act_stock_holder），jkd 使用 2g 堆空间都会导致 OutOfMemoryError，需要显示配置 8G 的堆空间才能同步成功，经验证oracle jdk arm 版 1.8.0_381 和 dragonwell jdk arm 版 1.8.0_332 都是如此。OutOfMemoryError详细的报错堆栈信息如下：

"0-0-0-reader" prio=5 tid=34 RUNNABLE
    at java.lang.OutOfMemoryError.<init>(OutOfMemoryError.java:48)
    at com.alipay.oceanbase.jdbc.MysqlIO.nextRowFast(MysqlIO.java:2657)
       Local Variable: byte[][]#535681
    at com.alipay.oceanbase.jdbc.MysqlIO.nextRow(MysqlIO.java:2320)
    at com.alipay.oceanbase.jdbc.MysqlIO.readSingleRowSet(MysqlIO.java:4207)
       Local Variable: java.util.ArrayList#4
    at com.alipay.oceanbase.jdbc.MysqlIO.getResultSet(MysqlIO.java:572)
       Local Variable: com.alipay.oceanbase.jdbc.Field[]#1
    at com.alipay.oceanbase.jdbc.MysqlIO.readResultsForQueryOrUpdate(MysqlIO.java:3651)
    at com.alipay.oceanbase.jdbc.MysqlIO.readAllResults(MysqlIO.java:2800)
    at com.alipay.oceanbase.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:3220)
       Local Variable: com.alipay.oceanbase.jdbc.MysqlIO#1
       Local Variable: com.alipay.oceanbase.jdbc.Buffer#1
       Local Variable: com.alipay.oceanbase.jdbc.Buffer#2
    at com.alipay.oceanbase.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2903)
       Local Variable: java.lang.String#218
    at com.alipay.oceanbase.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2855)
       Local Variable: java.lang.String#219
    at com.alipay.oceanbase.jdbc.StatementImpl.executeQuery(StatementImpl.java:1445)
       Local Variable: com.alipay.oceanbase.jdbc.StatementImpl$CancelTask#1
    at com.alibaba.datax.plugin.rdbms.util.DBUtil.query(DBUtil.java:471)
    at com.alibaba.datax.plugin.rdbms.util.DBUtil.query(DBUtil.java:443)
       Local Variable: com.alipay.oceanbase.jdbc.StatementImpl#1
    at com.alibaba.datax.plugin.rdbms.util.DBUtil.query(DBUtil.java:422)
    at com.alibaba.datax.plugin.rdbms.reader.CommonRdbmsReader$Task.startRead(CommonRdbmsReader.java:194)
       Local Variable: com.alipay.oceanbase.jdbc.JDBC4Connection#1
       Local Variable: com.alibaba.datax.common.util.Configuration#1
       Local Variable: java.lang.String#220
       Local Variable: com.alibaba.datax.common.statistics.PerfRecord#1
       Local Variable: com.alibaba.datax.plugin.reader.rdbmsreader.SubCommonRdbmsReader$Task#1
       Local Variable: com.alibaba.datax.core.statistics.plugin.task.StdoutPluginCollector#2
    at com.alibaba.datax.plugin.reader.rdbmsreader.RdbmsReader$Task.startRead(RdbmsReader.java:84)
       Local Variable: com.alibaba.datax.core.transport.exchanger.BufferedRecordExchanger#2
    at com.alibaba.datax.core.taskgroup.runner.ReaderRunner.run(ReaderRunner.java:57)
       Local Variable: com.alibaba.datax.core.taskgroup.runner.ReaderRunner#1
       Local Variable: com.alibaba.datax.plugin.reader.rdbmsreader.RdbmsReader$Task#1
       Local Variable: com.alibaba.datax.common.statistics.PerfRecord#2
       Local Variable: com.alibaba.datax.common.statistics.PerfRecord#4
       Local Variable: com.alibaba.datax.common.statistics.PerfRecord#3
       Local Variable: com.alibaba.datax.common.statistics.PerfRecord#5
    at java.lang.Thread.run(Thread.java:855)

3 问题原因

该问题跟 jdk 版本和 arm 架构无关，而是因为读取 Ob 数据时，默认情况下会一次性读取所有数据并加载到内存后再做后续处理，所以数据量大时会占用大量堆空间甚至oom，目前版本的oceanbasev10reader/rdbmsreader都存在该问题。

4 解决方案

可以在ob的jdbcurl中显示设置参数 useCursorFetch=true (>=5.0版驱动开始支持)，此时底层读取数据时会使用服务器端游标且每次从服务端批量读取 fetch_size 条数据进行处理，从而避免掉大数据量下占用堆空间大甚至 OOM 的问题（该推荐配置与UF30微服务略有不同）.
推荐的OB jdbc url格式如下（读写都可以使用该格式；oceanbasev10writer/oceanbasev10reader/rdbmswriter/rdbmsreader都可以使用该格式）：jdbc:oceanbase://10.20.182.144:2883/sys?rewriteBatchedStatements=true&useCursorFetch=true。
推荐使用 ob 的专用插件 oceanbasev10writer/oceanbasev10reader,作为 ob 专用插件，其底层自动配置了多个参数，比如oceanbasev10writer 会自动配置 rewriteBatchedStatements=ture,比如oceanbasev10reader会自动配置ResultSet.TYPE_FORWARD_ONLY，所以理论上同步性能会更好一些，特别是考虑到后续随着版本升级迭代，还会有一些功能增强问题修复之类的更新，所以推荐优先使用专用插件；
5 技术背景
datax 的 oceanbasev10reader/ oceanbasev10writer 专用插件，在底层会自动设置一些相关参数如 ResultSet.TYPE_FORWARD_ONLY/rewriteBatchedStatements，且当用户没有显示配置readBatchSize会自动设置 DEFAULT_READ_BATCH_SIZE.

6 不同 JDK 的性能差异

使用同样的上游ob数据源和下游hdfs数据源，且同一时间同一台机器分别提交两个datax，一个使用龙井一个使用oracle(oracle jdk arm 版 1.8.0_381 和 dragonwell jdk arm 版 1.8.0_332)，进行对比测试可以发现，在同步大量数据且配置堆空间为8G时，oracleJDK 和龙井 jdk在平均同步速度上差很多，前者只有 330KB/S, 后者能达到2.63MB/S，即龙井jdk arm版比oralce jdk arm更有性能优势；
其底层原因可能跟两者默认的GC参数不同有关(龙井arm默认是ParNew和ConcurrentMarkSweep，而oracle arm默认是PS Scavenge和PS MarkSweep)；
为进一步确认性能差异的原因，可以再指定GC参数对比测试下 oracle/dragonwell 的同步性能，其中 oracle jdk 可以使用如下命令指定GC参数，dragon使用默认GC参数即可（都需要配置JAVA_HOME环境变量）：
```
python /opt/DataX/bin/datax.py /tmp/ob.datax  --jvm='-Xms8196m -Xmx8196m -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -Doracle.jdbc.fanEnabled=false -Duser.timezone=GMT+8'
```

7. tcpdump- 抓包分析

在分析问题的过程中，我们通过在 datax 节点使用tcpdump 抓包并导入到wireshark进行分析（tcpdump -i any -nn -s 100 "port 2883 or port 8020" -w /tmp/ob.pcap），并发现了如下现象：

在不进行流控限制时（即不配置datax的"speed": { "channel": 5, "byte": 1048576, "record": 10000}），datax 读ob 和写 hdfs 时都有短时间内打满网络的现象（即TCP ZeroWindow 和 TCP Window Full）；
同时datax 写 hdfs 时会出现有规律地暂停10秒左右的现象，这是因为 orc 是列存储格式，datax 需要累积一批 row data 并计算转换为 orc 的 stripe后（包括stripe底层的index data/stripe footer）才能写入 hdfs。

聊聊 datax 的 OceanBase 数据同步插件 ||批处理参数 rewriteBatchedStatements=true&useCursorFetch=true

聊聊 datax 的 OceanBase 数据同步插件 ||批处理参数 rewriteBatchedStatements=true&useCursorFetch=true

1 背景

2 问题现象

3 问题原因

4 解决方案

5 技术背景

6 不同 JDK 的性能差异

7. tcpdump- 抓包分析

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

聊聊 datax 的 OceanBase 数据同步插件 ||批处理参数 rewriteBatchedStatements=true&useCursorFetch=true

聊聊 datax 的 OceanBase 数据同步插件 ||批处理参数 rewriteBatchedStatements=true&useCursorFetch=true

1 背景

2 问题现象

3 问题原因

4 解决方案

5 技术背景

6 不同 JDK 的性能差异

7. tcpdump- 抓包分析

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像