开发者社区 > 大数据与机器学习 > 检索分析服务 Elasticsearch版 > 正文

Logstash JDBC数据mysql同步es的延迟时间大概有多少

问题描述

Logstash JDBC数据同步的延迟时间到底有多少

  • 同步全量数据,接受秒级延迟的场景。
  • 批量查询数据然后进行同步的场景。

...

Logstash JDBC数据同步

通过logstash-input-jdbc插件实现通过Logstash批量查询RDS中的数据,并将数据迁移到Elasticsearch。实现的本质是该插件会定期对RDS中的数据进行循环轮询,从而在当前循环中找到上次插入或更改的记录,然后批量查询这些记录并迁移至Elasticsearch。与DTS同步方案相比,该方案的实时性较差,存在秒级延迟。

  • 同步全量数据,接受秒级延迟的场景。
  • 批量查询数据然后进行同步的场景。
  • 使用前,需要先在Logstash中上传与RDS版本兼容的SQL JDBC驱动。
  • 需要在RDS的白名单中加入Logstash集群中节点的IP地址。
  • 需要确保Logstash和RDS在同一时区(避免同步过程中出现时间标记不符的情况)。
  • 需要确保Elasticsearch中的_id字段与RDS中的id字段相同。
  • 当您在RDS中插入或更新数据时,需要确保对应记录有一个包含更新或插入时间的字段。

通过Logstash将RDS MySQL数据同步至Elastics

期望结果

...

已尝试的方法

...

展开
收起
辣椒炒辣椒 2022-10-12 10:10:40 154 0
2 条回答
写回答
取消 提交回答
  • 具体延迟时间需要你实际数据场景测试,目前只能说logstash方案适用的场景是能接受延迟秒级别的;若对实时性要求高推荐参考 同步方案选取指南:https://help.aliyun.com/document_detail/170426.html 中 DTS的方式实现数据同步

    2022-10-12 17:50:10
    赞同 展开评论 打赏
  • 这个跟用户的数据量、集群的状态和规格等很多因素有关的,没办法给出具体延迟时间。如果对数据同步的实时性要求较高,可以选择DTS的方案。

    如果出现同步任务失败(例如管道一直在生效中、前后数据不一致、数据库连接不成功),可以参考通过Logstash将RDS MySQL数据同步至Elasticsearch中的常见问题,排查一下。

    2022-10-12 17:34:41
    赞同 展开评论 打赏

阿里云检索分析服务Elasticsearch版兼容开源ELK功能,免运维全托管,提升企业数据检索与运维分析能力。

热门讨论

热门文章

相关电子书

更多
One Box: 解读事务与分析一体化数据库 HybridDB for MySQL 立即下载
One Box:解读事务与分析一体化数据库HybridDB for MySQL 立即下载
如何支撑HTAP场景-HybridDB for MySQL系统架构和技术演进 立即下载

相关镜像