开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks的Elasticsearch同步数据,源端是ES,目标端是MySQL,但是ES配置

已解决

DataWorks的Elasticsearch同步数据,源端是ES,目标端是MySQL,但是ES配置的索引有26条记录。也配置了分页大小23,为什么手动执行一次后,只同步了10条记录

解释说明: ES端根据索引查询语句如下

GET /disngdig-loodnhg-2022/_search { "from":0, "size":30, "query": {"match_all": {}} } 在ES端进行分页 查询,参数配置如下,scroll=10m,szie=15 数据显示查询为十五条

将数据源同步配置分页改为15后,数据还是显示为10条

将查询语句内参数设置为:scroll=30m,szie=30时,ES端会查询出26 条记录,但是 dw上按照这个配置游标分页都是30,运行读还是10条ES默认size是10。

展开
收起
阿里云服务支持 2022-12-09 13:04:01 246 0
1 条回答
写回答
取消 提交回答
  • 推荐回答
    官方回答

    1、客户端请求发给某个节点。

    2、节点转发给个个分片,查询每个分片上的前10条。

    3、结果返回给节点,整合数据,提取前10条。

    4、返回给请求客户端。

    image.png

    在Elasticsearch找到参数:index.max_result_window,无论Size设置多大都不能超过这个值。

    2022-12-09 13:09:56
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    阿里云Elasticsearch体系架构与特性解析 立即下载
    开源与云:Elasticsearch应用剖析 立即下载
    《Elasticsearch全观测解决方案》 立即下载

    相关镜像