DataWorks同步ES 数据到opds 越来越慢,有什么可以优化的?retryCount=[30                            ]
                       column=[["segment_id","is_error","time_bucket","statement","service_id","data_binary","start_time","endpoint_name_match","version","service_instance_id","endpoint_id","end_time","latency","service_name","endpoint_name","trace_id","service_name_match"]]
                       scroll=[10m                           ]
                        index=[skywalking_segment-20230726   ]
                     pageSize=[1000                          ]
                  connTimeOut=[600000                        ]
                         type=[default                       ]
               retrySleepTime=[10000                         ]
                       search=[{"match_all":{}}              ]
                      envType=[0                             ]
                   datasource=[bigdata_sla                   ]
                  readTimeOut=[600000                        ]
                         full=[false                         ]
Writer: odps
                    partition=[dt=20230726                   ]
                     truncate=[true                          ]
                      envType=[0                             ]
                   datasource=[odps_first                    ]
          isSupportThreeModel=[false                         ]
                       column=[["segment_id","is_error","time_bucket","statement","service_id","data_binary","start_time","endpoint_name_match","version","service_instance_id","endpoint_id","end_time","latency","service_name","endpoint_name","trace_id","service_name_match"]]
                  emptyAsNull=[false                         ]
                 tableComment=[ES中的全部数据                      ]
                        table=[ods_skywalking_XX ]
Setting:
                   errorLimit=[{"record":""}                 ]
                       locale=[zh                            ]
                        speed=[{"throttle":false,"concurrent":10}]
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
当DataWorks同步ES数据到ODPS的速度逐渐变慢时,可能是由于以下原因导致的:
数据量增加:随着时间的推移,ES中存储的数据量可能越来越大,导致同步数据的时间变长。
网络问题:如果网络带宽受限或网络延迟较高,也会导致数据同步速度变慢。
资源限制:如果同步任务所在的资源池资源有限或者被其他任务占用,也会导致任务执行速度变慢。
为了优化DataWorks同步ES数据到ODPS的速度,您可以考虑以下几个方面:
调整同步任务配置:可以针对同步任务的配置进行优化,例如调整同步规则和同步条件,合理设置并发度和数据分片等参数,以提高任务执行效率。
增加资源:可以考虑增加资源池的资源,或者使用更高配置的云服务器,以提高同步任务的运行速度和并发能力。
优化网络带宽:可以优化网络带宽,例如使用更高速的网络连接、增加网络带宽等方式,以提高数据传输速度和稳定性。
定期清理数据:可以定期清理ES中不必要的数据,以减少数据量,降低同步任务的执行时间
可以参考一下通用的提速方式 https://developer.aliyun.com/article/979768?spm=a2c6h.12873639.article-detail.79.7d3372fbs30XBu,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。