【最佳实践】DTS轻松实现RDS for MySQL与阿里云Elasticsearch数据实时同步

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: 本文介绍如何使用 DTS 快速创建RDS for MySQL->阿里云Elasticsearch的实时同步作业,实现RDS for MySQL数据到阿里云Elasticsearch的实时同步。

简介:

本文介绍如何使用 DTS 快速创建RDS for MySQL->阿里云Elasticsearch的实时同步作业,实现RDS for MySQL数据到阿里云Elasticsearch的实时同步。

本文字数: 2239
阅读时间: 5~8分钟

您将了解
1、支持实时同步的类型
2、支持SQL操作的类型
3、配置步骤

以下是正文


数据传输服务 DTS (以下简称 DTS)
支持RDS for MySQL与阿里云Elasticsearch实时同步数据,通过 DTS 提供的 RDS for MySQL->阿里云Elasticsearch实时同步功能,可以将企业线上RDS for MySQL中的生产数据实时同步到阿里云Elasticsearch中进行搜索。

支持实时同步类型

同一个阿里云账号下 RDS for MySQL->阿里云Elasticsearch实例。

支持SQL操作类型

主要支持的SQL操作类型如下:

  • Inset
  • Delete
  • Update

说明 目前暂不支持 DDL同步,如果同步过程中遇到DDL操作,DTS会忽略掉。

如果后续遇到DDL某个表,则对应表的DML操作可能失败,修复方法为:

  1. 参考减少同步对象先将这个对象从同步列表中摘除。
  2. 删除阿里云Elasticsearch中这个表对应的索引。
  3. 参考 新增同步对象, 修改这个同步作业,将这个表重新添加到同步对象中,进行重新初始化。

如果是修改表、新增列的DDL,建议DDL的操作顺序为:

  1. 先在阿里云Elasticsearch中手动修改对应表的mapping,新增列。
  2. 再在源RDS for MySQL实例中手动修改表结构,新增列。
  3. 暂停DTS同步实例,重启DTS同步实例让DTS重新加载阿里云Elasticsearch中修改后的mapping关系。

配置步骤

下面详细介绍创建RDS for MySQL实例到阿里云Elasticsearch实例同步链路的具体步骤。

  1. 购买同步链路
    进入数据传输服务 DTS控制台,进入数据同步界面,点击控制台右上角创建同步作业先购买一个同步链路,购买完同步链路后返回DTS控制台,进行配置同步链路。

说明:在配置同步链路之前需要先购买一个同步链路,同步链路目前支持包年包月及按量付费两种付费模式,可以根据需要选择不同的付费模式。

购买界面参数
  • 功能
    选择数据同步
  • 源实例
    选择MySQL
  • 源实例地域
    本示例为RDS for MySQL,需选择RDS for MySQL实例所在地域。
  • 目标实例
    选择Elasticsearch
  • 目标实例
    地域阿里云Elasticsearch实例所在地域,订阅后不支持更换地域,请谨慎选择。
  • 同步拓扑
    选择单项同步
  • 网络类型
    默认为专线,目前仅支持专线模式
  • 同步链路规格
    同步链路规格影响了链路的同步性能,同步链路规格跟性能之间的对应关系详见数据同步规格说明。
  • 订购时长
    如果是预付费,默认为1个月,支持勾选开启自动续费功能。
  • 购买数量
    默认为1,根据业务实际需要进行选择。

说明 DTS控制台的同步实例按照地域展示,刚才购买的同步实例所属的地域为同步实例的目标地域。例如上面购买的是 杭州RDS for MySQL->杭州阿里云Elasticsearch的同步实例,那么这个同步实例在DTS的杭州地区。进入杭州区域的实例列表,查找刚才购买的同步实例,然后点击新购实例右侧的 配置同步作业开始配置实例。

  1. 配置同步链路
    image.png

同步作业名称
同步作业名称没有唯一性要求,为了更方便识别具体的作业,建议选择一个有业务意义的作业名称,方便后续的链路查找及管理。、

源实例信息
本示例采用数据源为 RDS for MySQL,需要配置RDS实例的ID、数据库账号、数据库密码。

image.png

目标实例信息
目标实例信息中需要配置阿里云Elasticsearch的实例ID,及访问阿里云ES实例账号密码

image.png
以上内容配置完成后,点击授权白名单并进入下一步进行RDS for MySQL及阿里云Elasticsearch的白名单添加。

  1. 授权实例白名单

说明 如果是RDS for MySQL,DTS会自动添加白名单或安全组。

如果源实例为RDS for MySQL,那么DTS将自身的IP段添加到RDS实例的白名单的安全组中,避免因为RDS实例设置了白名单,DTS服务器连接不上数据库导致同步作业创建失败。为了保证同步作业的稳定性,在同步过程中,请勿将这些服务器 IP 从 RDS实例的白名单的安全组中删除。
当白名单授权后,点击下一步,进入同步账号创建。

  1. 选择同步对象
    当白名单授权完成后,即进入同步对象的选择步骤。在这个步骤可以配置需要同步的表列,以及索引的命名规则。
  2. 索引名称命名规则可以选择:表名、库名_表名。
  • 如果选择了表名,那么索引名称同表名。
  • 如果选择了库名表名,那么索引名称的命名格式为:库名表名。例如,库名为:dbtest,表名为:sbtest1,那么这张表同步到阿里云Elasticsearch后,对应的索引名称为:dbtest_sbtest1。
  • 如果需要同步的不同库中存在相同名称的表名,建议索引名称命名规则选择:库名_表名。
  1. 选择具体需要同步的库表列,实时同步的同步对象的选择粒度可以支持到表级别,即用户可以选择同步某些库或某几张表。
    实时同步的同步对象的选择粒度可以支持到表级别,即用户可以选择同步某些库或某几张表。

image.png

  1. 默认所有表的docid为表的主键,如果部分表没有主键,那么对于这部分配置docid 对应的源表的列。在右侧-已选择对象 框中,将鼠标挪到对应表上,点击右侧的 编辑 入口,进入这个表的高级设置界面。

image.png

  1. 在高级配置中可以设置:
    索引名称、Type名称、分区列及分区数定义、_id取值列。其中 _id 取值如果选择 业务主键,那么需要选择对应的业务主键列。

e.配置完同步对象后,进入高级配置步骤。

  1. 高级配置
    主要配置

a. 同步初始化类型,建议选择 结构初始化+全量数据初始化,由DTS自动进行索引的创建及全量数据的初始化。如果不选择结构初始化,那么需要在同步创建之前,先手动在阿里云Elasticsearch中完成索引mapping的定义。如果不选择全量数据初始化,那么DTS同步增量数据的起始时间点为:启动同步的时间点。

b. 索引分片配置,默认为5个分片,1个副本。可以根据业务需要进行调整,一旦调整后,所有的索引按照这个配置定义分片。

c.字符串analyzer定义,可以选择字符串的analyzer,默认为Standard Analyzer。取值包括:Standard Analyzer、Simple Analyzer、Whitespace Analyzer、Stop Analyzer、Keyword Analyzer、English Analyzer、Fingerprint Analyzer,所有索引的字符串字段按照这个配置定义Analyzer。

image.png

d. 时区,可以配置同步到阿里云Elasticsearch中的时间字段存储的时区,默认为东八区。

  1. 预检查同步作业配置完成后,DTS会进行预检查,当预检查通过后,可以点击 启动 按钮,启动同步作业。
    同步作业启动后,即进入同步作业列表,此时刚启动的作业处于同步初始化状态。初始化的时间长度取决于源实例中同步对象的数据量大小,初始化完成后,同步链路即进入同步中的状态,此时源跟目标实例的同步链路才真正建立。
  2. 数据效验以上任务完执行成后,登录阿里云ES控制台,确认对应阿里云ES实例中有无创建对应索引,及同步的数据是否符合预期。

加入我们

9.png

【云上ELK双11限时优惠】

  • 新购用户,预付首月 75折
  • 新购/续购/升级用户,预付6个月85折
  • 新购/续购/升级用户,预付12个月8折

2019年阿里云云栖大会上,Elasticsearch背后的商业公司Elastic与阿里云Elasticsearch确定战略合作升级,在100%兼容开源的基础上,完成了ELK的完整生态云上闭环,欢迎开通使用。
点击了解更多产品信息

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
3月前
|
SQL 关系型数据库 MySQL
阿里云《快速连接云数据库RDS》训练营,火热开营中!
快速连接云数据库 RDS 训练营开营啦!从 0 到 1 学习实战技能,涵盖 RDS MySQL 快速连接、DMS 数据管理及 SQL 实战案例。完成任务赢取专业飞盘、积木等好礼(限量 100 份)
|
6月前
|
关系型数据库 数据库 数据安全/隐私保护
云数据库实战:基于阿里云RDS的Python应用开发与优化
在互联网时代,数据驱动的应用已成为企业竞争力的核心。阿里云RDS为开发者提供稳定高效的数据库托管服务,支持多种数据库引擎,具备自动化管理、高可用性和弹性扩展等优势。本文通过Python应用案例,从零开始搭建基于阿里云RDS的数据库应用,详细演示连接、CRUD操作及性能优化与安全管理实践,帮助读者快速上手并提升应用性能。
|
9月前
|
消息中间件 关系型数据库 Kafka
一种小资源情况下RDS数据实时同步StarRocks方案
使用一台4C8 G服务器轻松实现2个MySQL实例中通过负责分库分表规则之后的5000多张表的数据实时同步到StarRocks
366 67
|
7月前
|
SQL 人工智能 关系型数据库
【PG锦囊】阿里云 RDS PostgreSQL 版插件—AI 插件(rds_ai)
本文介绍了AI 插件(rds_ai)的核心优势、适用场景等,帮助您更好地了解 rds_ai 插件。想了解更多 RDS 插件信息和讨论交流,欢迎加入 RDS PG 插件用户专项服务群(103525002795)
|
7月前
|
运维 关系型数据库 MySQL
体验领礼啦!体验自建数据库迁移到阿里云数据库RDS,领取桌面置物架!
「技术解决方案【Cloud Up 挑战赛】」上线!本方案介绍如何将自建数据库平滑迁移至云数据库RDS,解决业务增长带来的运维难题。通过使用RDS MySQL,您可获得稳定、可靠和安全的企业级数据库服务,专注于核心业务发展。完成任务即可领取桌面置物架,每个工作日限量50个,先到先得。
|
10月前
|
容灾 关系型数据库 数据库
阿里云RDS服务巴黎奥运会赛事系统,助力云上奥运稳定运行
2024年巴黎奥运会,阿里云作为官方云服务合作伙伴,提供了稳定的技术支持。云数据库RDS通过备份恢复、实时监控、容灾切换等产品能力,确保了赛事系统的平稳运行。
 阿里云RDS服务巴黎奥运会赛事系统,助力云上奥运稳定运行
|
10月前
|
Web App开发 JavaScript Java
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
这篇文章是关于如何使用Spring Boot整合Elasticsearch,并通过REST客户端操作Elasticsearch,实现一个简单的搜索前后端,以及如何爬取京东数据到Elasticsearch的案例教程。
644 0
elasticsearch学习五:springboot整合 rest 操作elasticsearch的 实际案例操作,编写搜索的前后端,爬取京东数据到elasticsearch中。
|
12月前
|
弹性计算 关系型数据库 MySQL
新一期陪跑班开课啦!阿里云专家手把手带你体验RDS通用云盘核心能力
本次课程将手把手带领用户创建一个云数据库RDS MySQL(通用云盘),并通过云服务器ECS对RDS MySQL实例进行压测,体验IO加速和IO突发带来的性能提升;并通过DMS执行DDL,将数据归档到OSS,再结合云盘缩容,体验数据归档带来的成本优势。
|
12月前
|
存储 缓存 监控
|
10月前
|
消息中间件 监控 关系型数据库
MySQL数据实时同步到Elasticsearch:技术深度解析与实践分享
在当今的数据驱动时代,实时数据同步成为许多应用系统的核心需求之一。MySQL作为关系型数据库的代表,以其强大的事务处理能力和数据完整性保障,广泛应用于各种业务场景中。然而,随着数据量的增长和查询复杂度的提升,单一依赖MySQL进行高效的数据检索和分析变得日益困难。这时,Elasticsearch(简称ES)以其卓越的搜索性能、灵活的数据模式以及强大的可扩展性,成为处理复杂查询需求的理想选择。本文将深入探讨MySQL数据实时同步到Elasticsearch的技术实现与最佳实践。
512 0

相关产品

  • 检索分析服务 Elasticsearch版
  • 下一篇
    对象存储OSS
    AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等

    登录插画

    登录以查看您的控制台资源

    管理云资源
    状态一览
    快捷访问