数据库生态工具&架构|学习笔记(二)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
数据传输服务 DTS,数据同步 small 3个月
推荐场景:
数据库上云
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 快速学习数据库生态工具&架构

开发者学堂课程【关系型数据库 ACP 认证课程数据库生态工具&架构】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/927/detail/14622


数据库生态工具&架构


1) 数据开发能力中周期集成介绍:

image.png数据库的调度任务以小时为单位进行调度,DMS就可以利用它基础的能力。

丰富数据源:

支持27种数据源,包括OLTP/OLAP/NoSQL/对象存储/数据湖;支持跨IDC、云厂商数据源的统一管理。

高性能:

支持分布式集成架构,突破单机瓶颈。同时,提供限流手段,按需先流保护数据源。

运维简单:

通过性能监控、端到端一键诊断功能及报警监控等策略,实现极低运维门槛。

灵活调度

可按需配置调度,最高调度周期可低至5分钟。

1. 数据迁移 DTS

1) 数据迁移DTS产品介绍

数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库、NoSQL、大数据(OLAP)、分布式数据库等数据源,集数据迁移、订阅、实时同步及ETL流式数据处理功能于一体,能够解决公共云、混合云场景下,远距离、秒级异步数据传输难题。其底层基础设施采用阿里双11异地多活架构,为数千下游应用提供实时数据流。

我们的业务方可以自己通过DTS提供的SDK来对接数据进行消费。

image.png2) 整体技术架构介绍:

主要是去消费数据源的一些日志然后去解析成一个中间格式,在针对不同的目标进行转换,最终投递到目标当中。这里面组件很多,比如可以通过控制台、API建立数据传输的任务。会有预检查过程,逐项通过才能往下走。数据的迁移会分成三个阶段:结构迁移、全量迁移和增量迁移。如果是数据订阅,可以通过SDK进行数据实时订阅。

l 全球公有云第一个数据流产品

l 阿里经济体数据库全球化和异地多活底座

l 9年打磨,支撑双11大促

l 支持多达20多种数据源和目标.服务近5万企业客户,已完成近60万个数据库上云

3) 数据实时同步链路原理:

结构迁移、全量迁移、增量迁移三者有机的使用,再结合实时同步就可以实现接近于零停机的迁移。

image.pngl 结构迁移∶迁移元数据。数据类型准确、PK/UK/索引约束准确

l 全量迁移∶迁移存量数据。对数据库影响低、速度快

l 增量拉取∶捕获迁移过程中的变化数据。数据保真、不丢数据

l 增量写入∶迁移增量数据。数据一致、链路无延迟。(幂等、冲突矩阵)

l 全量数据校验︰保障源和目标数据一致性。快速、具备订正能力

4) 多业务场景数据传输解决方案

数据库所在的网络经常是多种多样的,如果这写各种各样的数据库想要迁到云上来。就会面临网络的互通问题。

DTS致力于在公有云、混合云场景下,解决远距离、毫秒级异步数据传输难题,如不停机迁移上云、异地灾备、异地多活、数据中台实时数据集成、数据实时订阅等问题。它底层的数据流基础设施为阿里双11异地多活基础架*为数万下游应用提供实时数据流。用户可以使用数据传输轻松构建安全、可扩展、高可用的数据架构。image.png 

5) 数据实时订阅

主要通过数据订阅支持实时拉取RDS实例的增量日志,用户可以通过DTS提供的SDK数据订阅服务端或者kafka client来订阅增量日志,同时可以根据业务需求,实现数据定制化消费。DTS负责从源库来拉取日志然后进行存储,业务端通过SDK来消费,来实现下游的业务处理。

image.pngDTS服务端的日志拉取模块主要实现从数据源抓取原始数据,通过解析、过滤、标准格式化等流程,最终将增量数据在本地持久化。

日志抓取模块通过数据库协议连接并实时拉取源实例的增量日志。例如源实例为RDS for MySQL,那么数据抓取模块通过Binlog dump协议连接源实例.日志拉取模块及下游消费SDK的高可用:DTS容灾系统一旦检测到日志拉取模块出现异常,就会在健康服务节点上断点重启日志拉取模块,保证日志拉取模块的高可用。

DTS支持在服务端实现下游SDK消费进程和client的高可用。用户同时对一个数据订阅链路,启动多个下游SDK消费进程和消费client ,服务端同时只向下游消费推送增量数据,当这个消费进程异常后,服务端会从其他健康下游中选择一个消费进程,向这个消费进程推送数据,从而实现下游消费的高可用。

6) 业务数据实时分析与计算

场景说明∶用户需要实时或定期对线上业务数据进行数据分析,以实现营销决策,业务大屏,实时查询等业务场景

解决方案∶使用数据同步功能,将线上业务变更数据准实时同步到大数据分析产品中,业务实现准实时数据分析,快速抢占商务先机。

实时分析:

业务更新数据需要同步到AnalyticDB/Maxcompute中,跟其他数据进行实时交叉查询分析。

流式分析:

流式分析需要借助流计算对线上业务更新数据进行流式分析。

2. 数据备份服务 DBS

1) 数据备份服务DBS的产品介绍

● 数据备份(简称DBS)是阿里云提供的低成本、高可靠的云原生数据备份平台。DBS旨在保护数据资产、激活数据价值。

● DBS提供无限容量的备份存储、秒级应急恢复和恢复演练,并借助秒级沙箱实例和备份数据查询激活冷数据。DBS支持MySQL、SQL Server、Oracle等近10种数据库,支持文件、日志、数据库等全站备份,支持本地数据中心、其他云厂商、ECS数据库及RDS数据库等环境,是客户首选的企业级混合云统一备份平台。

● DBS旨在保护数据资产、激活数据价值。

image.png2) 数据备份服务DBS的产品介绍-数据副本管理(CDM)

通过CDM可以把来自于阿里云或者其他云提供的数据源,都可以同步到DBS中。

image.pngDBS服务端大体架构分为三层。中间层为混合云备份管理,包括备份策略、数据源、存储管理、备份数据、应急容灾、恢复演练、对比校验、监控告警。中间层之上是云原生数据应用,包括开发测试、历史归档、数据湖分析、云容灾。最下面是混合云存储管理。

3) 数据备份服务DBS支持的数据源及其环境

数据源:

①数据库︰

● OLTP : MySQL、Oracle、sQL Server、PostgresQL、PolarDB MySQL、PolarDB PostgresQL、PolarDB O、PolarDB-X

● OLAP :ADB PG,ADB MySQL

● NoSQL : Redis、MongoDB

②文件︰文件、审计日志

环境:

①阿里云∶阿里云数据库、阿里云ECS自建数据库和文件

②混合云∶本地IDC自建数据库和文件

③其他云∶AWS、华为云、腾讯云、京东云、UCloud等自建数据库和文件

4) 数据备份服务DBS支持的存储类型

云存储:

①分布式快照存储:CDM

②分布式对象存储:OSS/S3

③分布式文件系统∶

● Lindorm/HDFS

● NAS ( NFS/SMB )

归档存储:

①归档型OSS

②阿里云ECS/本地IDC:Linux/Windows服务器自动/手动

③本地IDC :

● NAS、FTP、Minio ( S3 )

● 蓝光、光盘

5) 数据备份服务DBS支持的备份方式

①数据:

物理备份,包括全量、增量、日志

逻辑备份,包括全量、日志

快照备份,包括全量、日志

②上传:流式备份、转储备份、挂载备份

③加速:置并发数提升备份恢复速度

④限流:置IO限流值或带宽限流值

⑤安全:

配置HTTPS传输加密

配置AES256和BYOK存储加密

⑥降本:

配置GZIP、LZ4、引擎内置压缩算法

部分版本可配置源端、异步重删

⑦网络:公网、专线、cen、数据库网关DG(无需暴露公网)接入

⑧计算:配置SQL进行历史数据归档

⑨存储:配置多级存储池进行多级数据流转和管理

6) 数据备份服务DBS支持的恢复方式

①恢复粒度:例、库、表恢复

②恢复环境:可挂载CDM存储盘恢复到原实例、自建新实例、RDS新实例、CDM沙箱新实例

③恢复新实例规格:按需创建指定规格

④可恢复时间点:物理、逻辑、快照备份的全量可恢复当前全量时间点,增量备份可恢复当前增量时间点,日志备份可恢复任意时间点

⑤恢复演练:定时恢复到RDS、CDM秒级恢复演练,数据可用性校验,演练和可用性报告。

7) 数据备份服务DBS支持的备份数据应用方式

①SQL查询备份:CDM沙箱实例可查询任意时刻数据状态,DLA可查询全量备份数据状态

②下载出云:配置手工、自动下载出云

③下载计算:全量备份转CSV、打包计算

8) 数据备份服务DBS的典型应用场景

①统一备份∶云数据库/自建库、维护/巡检/策略/账号/优化

②库表恢复∶仅单库或单表恢复到源实例

③应急恢复∶全增合并(后台)、快照挂载(秒级)、日志应用(任意时间点)、1TB/2分钟(数据恢复)、512MB/5分钟(日志恢复)

④恢复演练∶备份数据自动做恢复验证并产出演练报告

⑤数据构建︰备份数据应用,用于开发/测试/压测/报表/分析跨地域⑥跨地域备份︰跨境、跨云、跨可用区

⑦数据归档∶释放前保留、行级数据保留并清理(DMS)

⑧备份到本地∶备份到客户存储,NAS/S3等

⑨备份上云∶冷备到阿里云,同地或异地

⑩灾备上云∶冷备到阿里云,云端快速拉起


二、 回顾与总结

image.png阿里云的数据库生态工具分别是:

数据库自治服务DAS:数据库常见问题和解决方案,自治数据库发展趋势与核心技术,数据库自治服务功能与技术解析。

数据管理DMS:数据管理DMS功能简介。

数据传输服务DTS:数据迁移DTS功能简介。

数据库备份DBS:数据备份DBS功能简介。

 

三、 试题

1、数据库自治服务DAS是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务。以下属于DAS主要功能的是()

A、SQL诊断和优化

B、慢SQL分析

C、增量SQL分析

D、全量SQL分析

E、快SQL分析

DAS主要功能的是SQL诊断和优化、慢SQL分析、全量SQL分析,快SQL分析,是没有这种说法的。

2、数据库备份DBS是阿里云提供的低成本、高可靠的云原生数据库备份平台。DBS通过备份网关连接服务器,进行备份、恢复及下载数据等操作。以下()需要用户安装DBS备份网关。

A、RDS数据库物理备份

B、自建MySQL数据库物理备份

C、自建SQL Server数据库物理备份

D、RDS数据库逻辑备份

如果是阿里云自己的数据库里面,就不需要去安装备份的网关,阿里云自己就打通了。只有在自建的数据库上才需要去安装备份的网关。

3、备份集的生命周期为备份数据在数据库备份DBS中的保存周期。用户可以配置备份集生命周期,DBS会根据自定义的规则来自动进行备份集转存与过期清理。下列关于备份集的生命周期说法正确的是()。

A、在创建备份计划后修改了生命周期,修改后的新配置规则对新生成备份集和已存在备份集都生效

B、在创建备份计划后修改了生命周期,修改后的新配置规则仅对新生成备份集生效,对已存在备份集都不生效

C、DBS根据生命周期清理过期备份集的条件为该备份计划的全量备份集大于3个

D、只有全量数据备份设置生命周期,增量备份不支持设置生命周期

在创建备份计划后修改了生命周期,修改后的新配置规则对新生成备份集和已存在备份集都生效的。过期清理的规则是,为这个备份计划的群量备份集如果大于3个就会产生过期清理操作。没有达到就不会触发过期清理。D错在全量增量都支持设置生命周期的。

4、某用户将PolarDB历史库作为阿里云RDS MySQL或者PolarDB MySQL引擎数据库服务的归档存储地,将访问较少的历史数据迁移到PolarDB MySQL引擎X-Engine中存储,释放在线数据库的空间以降低成本并提升性能,那么该用户可以通过()将在线数据迁移至PolarDB历史库。

A、DAS

B、DTS

C、DMS

D、DBS

可以通过DMS周期性的把在线的数据给导入带PolarDB历史库当中。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
14天前
|
弹性计算 运维 监控
阿里云云服务诊断工具:合作伙伴架构师的深度洞察与优化建议
作为阿里云的合作伙伴架构师,我深入体验了其云服务诊断工具,该工具通过实时监控与历史趋势分析,自动化检查并提供详细的诊断报告,极大提升了运维效率和系统稳定性,特别在处理ECS实例资源不可用等问题时表现突出。此外,它支持预防性维护,帮助识别潜在问题,减少业务中断。尽管如此,仍建议增强诊断效能、扩大云产品覆盖范围、提供自定义诊断选项、加强教育与培训资源、集成第三方工具,以进一步提升用户体验。
663 243
|
2月前
|
存储 SQL 关系型数据库
Mysql学习笔记(二):数据库命令行代码总结
这篇文章是关于MySQL数据库命令行操作的总结,包括登录、退出、查看时间与版本、数据库和数据表的基本操作(如创建、删除、查看)、数据的增删改查等。它还涉及了如何通过SQL语句进行条件查询、模糊查询、范围查询和限制查询,以及如何进行表结构的修改。这些内容对于初学者来说非常实用,是学习MySQL数据库管理的基础。
141 6
|
3月前
|
设计模式 缓存 关系型数据库
探索微服务架构中的数据库设计挑战
微服务架构因其模块化和高扩展性被广泛应用于现代软件开发。然而,这种架构模式也带来了数据库设计上的独特挑战。本文探讨了在微服务架构中实现数据库设计时面临的问题,如数据一致性、服务间的数据共享和分布式事务处理。通过分析实际案例和提出解决方案,旨在为开发人员提供有效的数据库设计策略,以应对微服务架构下的复杂性。
|
1月前
|
存储 SQL Apache
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库,以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景,适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃,已广泛应用于电商、广告、用户行为分析等领域。
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
|
1月前
|
缓存 关系型数据库 MySQL
高并发架构系列:数据库主从同步的 3 种方案
本文详解高并发场景下数据库主从同步的三种解决方案:数据主从同步、数据库半同步复制、数据库中间件同步和缓存记录写key同步,旨在帮助解决数据一致性问题。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
高并发架构系列:数据库主从同步的 3 种方案
|
1月前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
144 4
国产数据实战之docker部署MyWebSQL数据库管理工具
|
1月前
|
存储 NoSQL 分布式数据库
微服务架构下的数据库设计与优化策略####
本文深入探讨了在微服务架构下,如何进行高效的数据库设计与优化,以确保系统的可扩展性、低延迟与高并发处理能力。不同于传统单一数据库模式,微服务架构要求更细粒度的服务划分,这对数据库设计提出了新的挑战。本文将从数据库分片、复制、事务管理及性能调优等方面阐述最佳实践,旨在为开发者提供一套系统性的解决方案框架。 ####
|
1月前
|
消息中间件 数据库 云计算
微服务架构下的数据库事务管理策略####
在微服务架构中,传统的单体应用被拆分为多个独立的服务单元,每个服务维护自己的数据库实例。这种设计提高了系统的可扩展性和灵活性,但同时也带来了分布式环境下事务管理的复杂性。本文探讨了微服务架构下数据库事务的挑战,并深入分析了几种主流的事务管理策略,包括Saga模式、两阶段提交(2PC)以及基于消息的最终一致性方案,旨在为开发者提供一套适应不同业务场景的事务处理框架。 ####
|
2月前
|
SQL Ubuntu 关系型数据库
Mysql学习笔记(一):数据库详细介绍以及Navicat简单使用
本文为MySQL学习笔记,介绍了数据库的基本概念,包括行、列、主键等,并解释了C/S和B/S架构以及SQL语言的分类。接着,指导如何在Windows和Ubuntu系统上安装MySQL,并提供了启动、停止和重启服务的命令。文章还涵盖了Navicat的使用,包括安装、登录和新建表格等步骤。最后,介绍了MySQL中的数据类型和字段约束,如主键、外键、非空和唯一等。
79 3
Mysql学习笔记(一):数据库详细介绍以及Navicat简单使用
|
1月前
|
设计模式 存储 缓存
微服务架构下的数据库设计策略
本文探讨了在微服务架构中进行数据库设计时,如何平衡数据的一致性、独立性与系统整体性能之间的关系。文章首先介绍了微服务架构的基本概念及其对数据库设计的影响,随后深入分析了三种主流的数据库设计模式——集中式、去中心化和混合模式,并结合实际案例讨论了它们的适用场景与优缺点。此外,还提出了一系列最佳实践建议,旨在帮助开发者更好地应对微服务环境下的数据管理挑战。