开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中datax单并发 odpsreader是50MB/s,差了不是一点点?

DataWorks中datax单并发 odpsreader是50MB/s,tunnel单并发是207KB/s,差了不是一点点?image.png
image.png

展开
收起
真的很搞笑 2023-12-24 13:13:52 133 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    DataX是阿里巴巴集团内广泛使用的离线数据同步工具,可以实现MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、OTS、ODPS等各种异构数据源之间的高效数据同步。在DataWorks中,DataX的单并发odpsreader的速度是50MB/s。

    这个速度并非固定不变的,而是受到多种因素的影响。首先,数据同步速度受限于来源和目标端数据库环境以及同步任务的配置。这包括源端和目的端数据库的性能、负载和网络情况等。例如,如果源头数据库的性能不佳,或者网络带宽有限,那么数据的读取速度就会受到影响。

    其次,DataX的实现机制也会影响数据同步速度。根据配置的源头项目/表/分区/表字段等信息,ODPSReader会通过Tunnel从ODPS系统中读取数据。如果Tunnel的使用不当,可能也会导致数据读取速度下降。

    因此,如果您发现DataX的单并发odpsreader的速度不满意,可以尝试优化源头和目标端的数据库环境,调整DataX的任务配置,或者检查Tunnel的使用情况,以提高数据同步速度。

    2023-12-25 14:24:28
    赞同 展开评论 打赏
  • 建议是参考阿里云官方文档的说明 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-12-25 08:01:19
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks高效数据分析最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载