《阿里云认证的解析与实战-关系型数据库ACP认证》——数据库生态工具—— 三、数据传输服务DTS

本文涉及的产品
数据传输服务 DTS,数据迁移 small 3个月
推荐场景:
MySQL数据库上云
数据传输服务 DTS,数据同步 small 3个月
推荐场景:
数据库上云
数据传输服务 DTS,数据同步 1个月
简介: 《阿里云认证的解析与实战-关系型数据库ACP认证》——数据库生态工具—— 三、数据传输服务DTS

1. 数据迁移DTS产品介绍

 

数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库、NoSQL、大数据(OLAP)、分布式数据库等数据源,集数据迁移、订阅、实时同步及ETL流式数据处理功能于一体,能够解决公共云、混合云场景下,远距离、秒级异步数据传输难题。其底层基础设施采用阿里双11异地多活架构,为数千下游应用提供实时数据流。

image.png

 

业务方可以自己通过DTS提供的SDK来对接数据来进行消费,实现业务定制化。

 

2. 整体技术架构介绍

image.png

 

全球公有云第一个数据流产品

阿里经济体数据库全球化和异地多活底座

9年打磨,支撑双11大促

支持多达20多种数据源和目标,服务近5万企业客户,已完成近60万个数据库上云。

 

DTS的架构主要是消费数据源日志,解析成中间格式,针对不同的目标进行转换,最终投递到目标当中。DTS运维平台有很多组件,可以通过用户控制台或者API等组件建立数据传输任务。

 

3. 数据实时同步链路原理

 image.png

 

结构迁移:迁移元数据。数据类型准确、PK/UK/索引约束准确。

全量迁移:迁移存量数据。对数据库影响低、速度快。

增量拉取:捕获迁移过程中的变化数据。数据保真不丢数据。

增量写入:迁移增量数据。数据一致、链路无延迟。(幂等、冲突矩阵)。

全量数据校验:保障源和目标数据一致性。快速、具备订正能力。

 

4. 多业务场景数据传输解决方案

 

DTS致力于在公有云、混合云场景下,解决远距离、毫秒级异步数据传输难题,如不停机迁移上云、异地灾备、异地多活、数据中台实时数据集成、数据实时订阅等问题。

 

DTS底层的数据流基础设施为阿里双11异地多活基础架构,为数万下游应用提供实时数据流。用户可以使用数据传输轻松构建安全、可扩展、可用的数据架构。

image.png

 

5. 数据实时订阅

image.png

 

数据订阅支持实时拉取RDS实例的增量日志,用户可以通过DTS提供的SDK数据订阅服务端或者kafka client来订阅增量日志,同时可以根据业务需求,实现数据定制化消费。

DTS服务端的日志拉取模块,主要实现从数据源抓取原始数据,通过解析、过滤标准格式化等流程,最终将增量数据在本地持久化。

日志抓取模块通过数据库协议连接并实时拉取原实例的增量日志。例如原实例为RDS for MySQL,那么数据抓取模块通过Binlog dump协议连接原实例。

日志拉取模块及下游消费SDK的高可用:DTS容灾系统一旦检测到日志拉取模块出现异常,就会在健康服务节点上断点重启日志拉取模块,保证日志拉取模块的高可用。

DTS支持在服务端实现下游SDK消费进程和client的高可用。用户同时对一个数据订阅链路,启动多个下游SDK消费进程和消费client,服务端同时只向一个下游消费推送增量数据,当这个消费进程异常后,服务端会从其他健康下游中选择一个消费进程,向这个消费进程推送数据,从而实现下游消费的高可用。

 

6. 业务数据实时分析与计算

 

场景说明:用户需要实时或定期对线上业务数据进行数据分析,以实现营销决策,业务大屏,实时查询等业务场景。

解决方案:使用数据同步功能,将线上业务变更数据准实时同步到大数据分析产品中,业务实现准实时数据分析,快速抢占商务先机。

image.png

 

实时分析

业务更新数据需要同步到AnalyticDB/Maxcompute中,跟其他数据进行实时交叉查询分析。

 

流式分析

需要借助流计算对线上业务更新数据进行流式分析。

 

相关文章
|
9天前
|
存储 人工智能 数据管理
|
2天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
8天前
|
NoSQL 关系型数据库 分布式数据库
基于PolarDB的图分析:通过DTS将其它数据库的数据表同步到PolarDB的图
本文介绍了使用DTS任务将数据从MySQL等数据源实时同步到PolarDB-PG的图数据库中的步骤.
|
20天前
|
存储 关系型数据库 MySQL
double ,FLOAT还是double(m,n)--深入解析MySQL数据库中双精度浮点数的使用
本文探讨了在MySQL中使用`float`和`double`时指定精度和刻度的影响。对于`float`,指定精度会影响存储大小:0-23位使用4字节单精度存储,24-53位使用8字节双精度存储。而对于`double`,指定精度和刻度对存储空间没有影响,但可以限制数值的输入范围,提高数据的规范性和业务意义。从性能角度看,`float`和`double`的区别不大,但在存储空间和数据输入方面,指定精度和刻度有助于优化和约束。
|
10天前
|
人工智能 Cloud Native 关系型数据库
双位数增长,阿里云连续五年领跑关系型数据库
阿里云蝉联中国关系型数据库整体市场份额第一,在公有云业务双位数增长的驱动下,阿里云同时在公有云关系型数据库市场取得了38%的市场份额,连续五年位居首位。
|
12天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
39 3
|
12天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
42 3
|
12天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
54 2
|
25天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
178 15