浅谈数据同步

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 数据同步在后端是非常常见的场景,数据同步的稳定性和实时性对业务有非常重要的影响。数据同步的方式主要有全量同步和增量同步两种,本文主要介绍上述两种方式的差异,以及常用的解决方案。

数据同步指的是将数据从一个数据库迁移至另外一个数据库,可以是同构数据库(例如从MySQL到MySQL),也可以是异构数据库(例如从MySQL到Elasticsearch),无论那种形式,同步的方法无外乎分为全量同步和增量同步。

全量同步

全量同步是指定时从源数据库中读取全量数据,然后直接写入到目的数据库中。当数据量特别大时,可以分批次读取和写入。然而,这其实是一种深翻页的操作,这会给数据库带很大的压力,会影响线上正常业务的响应时长。


为了配合全量同步,在每次开始同步之前,目的数据库需先清理现存数据,或者将新数据写入到临时表中,同步完成后再删除原数据。


综上所述,全量同步的优点是实现简单,无需借助其他数据同步中间件。但缺点却非常明显,数据更新不及时,同步时占用CPU和内存资源较多,最坏的情况下,会占用两倍磁盘空间。


增量同步

增量同步是指首次同步时采取全量同步的方式,之后只同步数据的变动,例如新增、更新、删除。增量同步需要解析数据库本身的log日志,例如MySQL的binlog。有许多中间件可以帮助我们来实现增量同步,例如canal、datax等。针对异构数据库同步的场景,建议使用kafka等消息中间件,来进行数据清洗、格式转化等操作,灵活性更大。


总结

建议在任何场景下,都要使用增量同步的方式。既能保证数据的实时性,又能降低同步时对源数据库的影响。贪图省事儿,大干快上,后期只能偿还技术债。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
7月前
|
消息中间件 SQL 分布式计算
一篇文章搞定数据同步工具SeaTunnel
一篇文章搞定数据同步工具SeaTunnel
4740 0
|
6月前
|
SQL 存储 关系型数据库
DataX - 全量数据同步工具(2)
DataX - 全量数据同步工具
|
1月前
|
缓存 前端开发 安全
数据同步原理
数据同步原理
88 10
数据同步原理
|
6月前
|
存储 Oracle 关系型数据库
几种常见的数据同步方式
【6月更文挑战第18天】几种常见的数据同步方式
787 4
|
6月前
|
SQL 关系型数据库 MySQL
DataX - 全量数据同步工具(1)
DataX - 全量数据同步工具
|
7月前
|
数据采集 缓存 搜索推荐
数据同步问题
数据同步问题
92 1
|
7月前
|
存储 NoSQL 数据库连接
Redis主从模式以及数据同步原理:全量数据同步、增量数据同步
Redis主从模式以及数据同步原理:全量数据同步、增量数据同步
835 0
|
DataWorks 关系型数据库 MySQL
DataWorks可以通过数据同步任务(DTS)实现OceanBase和其他数据库之间的实时数据同步
DataWorks可以通过数据同步任务(DTS)实现OceanBase和其他数据库之间的实时数据同步
251 2
|
DataWorks 关系型数据库 MySQL
可以使用DataWorks的数据同步任务(DTS)来实现实时同步
可以使用DataWorks的数据同步任务(DTS)来实现实时同步
496 2
|
关系型数据库 MySQL 数据库
数据同步系统
数据同步系统
150 2