数据库生态工具&架构|学习笔记(一)

简介: 快速学习数据库生态工具&架构

开发者学堂课程【关系型数据库 ACP 认证课程数据库生态工具&架构】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/927/detail/14622


数据库生态工具&架构

 

一、 数据库生态工具

二、 回顾与总结

三、 试题

 

一、 数据库生态工具

阿里云数据库生态工具,有四个分别是:数据自治服务DAS、数据管理DMS、数据传输服务DTS和数据库备份DBS。

1. 数据自治服务 DAS

简介:数据库自治服务( Database Autonomy Service,简称DAS)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

image.png数据库对很多企业来讲都是业务的基座,企业里面的研发、测试和运营等等,很多人都需要对数据库进行操作,比如说查询。但是这些人对数据库的了解的程度是不一样的,随着业务迭代的速度越来越快,人员彼此业务上也有交叉,越来越频繁,数据库的故障,无论是新闻也好,或者日常的工作当中实际遇到的事情,不再是很新鲜的事儿了。比如说生产业务上出现的问题,或业务大促期间出现性能的瓶颈需要扩容出现的问题,或者表结构、索引出现的一些问题等等。偏偏数据库的问题排查和性能优化一直是一个比较专业的问题,即使是一些很专业的DBA在面对一些棘手问题的时候,也很耗费脑力和时间。

所以对使用数据库带来了越来越大的挑战。基于这样的一个背景,阿里云推出了数据库自治服务。通过DAS操作系统自己不断的构建自主学习的能力。比如异常的自动标注、案例系统的设置、异常的模拟等等,形成一套完善的自治服务。目前DAS操作系统拥有六个知识特性。分别是:72小时的异常检测、故障自愈、自动SQL优化、智能调参、自动弹性伸缩和智能压测和容量评估。

1) 性能指标异常检测

DAS对数据库在运行的状态进行监控的功能。传统的方式是通过规则告警,CPU连续三次超过90%,才会触发告警。导致触发告警的异常信息存在一定的滞后性。DAS是基于实时的机制进行检测,因为利用了机械学习的一些技术。所以可以对监控指标和日志数据等等进行全方位的监控。

image.png图中CPU利用率不断上升,DAS可以比传统的方式更早的发现数据库异常指标,从而降低对业务的影响。

DAS检测异常指标的方法上主要有这五个:毛刺( Spike ) 、周期性( Seasonality )、趋势( Trend )、均值偏移( Meanshift )、新增( Emergence )。

毛刺( Spike ) :短时间内突增突降

常见场景:

l 故障抖动,数据库活跃线程飙升

l 瞬间流量波动,如:秒杀业务场景

示例:

image.png周期性( Seasonality ):周期规律性变化

常见场景:

l 业务高峰和低峰

l 工作日和周末时间段波动区别

l 周期性任务

示例:

image.png趋势( Trend ) :按某种规则稳步地增长或下降

常见场景:

l 流量、CPU利用率等逐渐增长

l 库表、磁盘空间使用增长

示例:

image.png均值偏移( Meanshift ):在某个时间点发生转折变化

常见场景:

l 业务大促

l 磁盘空间进行日志清理

示例:

image.png新增( Emergence ):和过去对比,新增的对象

常见场景:

l 业务新功能发布

l 执行方式发生变化

image.png2) SQL诊断和自动SQL优化

主要去是识别出日行效率比较地下的SQL,对他们进行诊断分析并进行一些合理的优化,来达到自动优化SQL的效果。自动SQL优化本身是基于数据驱动的闭环流程。

image.png异常的事件是异常的SQL引发的,这个是由DAS的事件中心进行检测的,这时候就会触发进行检测,诊断发起。发起后DAS会对实例进行初步的诊断,通过表维度视维度来生成若干条的诊断结果和优化的建议,就会推送到DAS自治中心里面,页面里面就会看到。然后根据建议做优化,选择合适的运维窗口期进行执行。后端会有机械学习引擎在,随意会持续的跟踪这个效果。

规模性:足具扩展性的服务架构,以支撑几十万级、百万级的大规模自动优化。

精准性:异常检测机制,实现优化时机的精准识别,问题SQL的精准定位。

安全性:线上无小事,线上变更如何做到安全可控。

全面性:优化效果的全面多维度跟踪,全面实时评估,也是保证安全性的要求。

联动性:综合治理能力,如突发的恶性慢SQL问题,DAS的自动SQL限流,自动SQL优化需要形成联动效应,实现问题的标本兼治。

3) 自动空间的优化

针对数据库实例的存储空间进行优化。帮助我们节省数据库实例的磁盘空间。

image.png

自动空间优化手段:无流量表识别、Optimize Table、无流量索引识别、冗余索引

4) 自动SQL限流

遇到缓存穿透或者性能低下的“烂SQL”。导致业务流量跌停的情况。传统解决方案里面这种方式不是很好来解决的,我们只能接受业务崩溃或者开发人员把这个问题找到。自动SQL限流是对数据库实例上的特定的SQL来采取限制运行措施的功能。至少应急是非常有用的,可以对SQL的数据进行监控,有效的识别出当前的SQL是阻塞型SQL、资源消耗型SQL还是流量型SQL。当DAS检测到数据库实例资源紧张的信息的时候会把问题SQL的语句识别出来并且给出相应的限流建议。

5) 自动的弹性伸缩

是指DAS会根据数据库实例在运行的时候负载还有一些设计的策略自动的调整数据库的计算能力。比如说当数据库出现资源紧张的时候就给出推荐的合理的扩容规格,快速把数据库实例的规格提上去。当负载下降以后通过降配的方式来回收。

image.png在图中这个业务实例流量是逐步升高的。DAS经过诊断以后发现当前的流量是只读流量占了大部分,所以给出建议增加两个只读节点来应对负载。随后又出现溯源紧张的情况。诊断出读写流量占比都比较大。这时候就采取弹性伸缩提高规格。两次突发情况变配的事件都比较短,但是累计的收益时间很长。

6) 智能压测

主要针对SQL的流水进行处理后记录真实业务的一些行为,然后进行回访模拟。就可以在大促前对数据库性能进行精确的评估。这个功能是和达摩院共同研发出来的。

image.png

低负载捕获真实业务流量、支持写流量回放压测、通过学习自动生成压测流量、支持语法自动转换。

2. 数据管理 DMS

DMS是面向数据库开发者、数据开发者的一站式在线数据管理平台。

image.png如上图,DMS是几乎全面支持阿里云生态里的几乎所有的数据源。面向这些数据源,DMS提供了四个方面的管理能力:数据资产与安全、数据设计与开发、数据传输与加工、数据应用。这些能力主要构成的这几个大类的功能:统一数据目录、数据治理、数据血缘、数据隐私与脱敏、协作开发、安全管控、数据集成、编排调度。可以应对很多的场景,比如说数据化运维DataOps、容灾/多活、T+1/实时/归档、数据集中处理、可视化报表、多维分析等等。

1) 数据管理DMS企业级能力简介:

一站式数据管理DMS提供了包含全域数据资产、数据库设计与开发、数据集成、数据开发、数据可视化及数据服务等能力。通过内置阿里巴巴数据库研发规范及数据安全最佳实践,DMS可帮助企业实现高效敏捷、安全可靠的数据生产、处理及消费等一站式的体验。

一站式数据管理平台:

● 覆盖27种常见数据源

● 跨云/IDC支持多环境的数据源

● 覆盖数据全生命周期的所有管理功能

全域数据资产:

● 覆盖常见的数据存储搜索分析,轻松理解数据

大规模实践的安全能力

● 端到端数据安全治理能力,轻松应对合规认证。

23种数据源实时集成:

● 基于数据库日志解析+分布式调度框架,实现秒级延迟的数据实时集成

零代码+E2E诊断:

● 全图形化/向导式,E2E自助诊断运维、数据血缘及变更联动降低数据处理门槛

高效敏捷:

● 阿里巴巴规模实践的DataOps流程实现数据开发加工的高效敏捷

2) 数据安全能力架构与简介:

在企业里安全是一个重要的细节。尤其有些企业人员规模越来越大,人员账号管理混乱最小化权限授予原则难以保障,敏感数据需要有效识别、脱敏合规审计支撑,使安全成为很管理的点。面对这些问题DMS分别从事前、事中、事后三个阶段来提供安全的能力。

事前:企业域账号对接,数据自动分类、分级,细粒度权限分配,语法级安全规则管控。

事中(实时):鉴权,脱敏(静态环境构建、动态实时访问),性能安全拦截,语法规则拦截。

事后:全流水操作日志,基于人员的操作审计,基于数据库操作的操作审计,水印追溯(防泄漏)。

企业管理实时联动,基于OpenAPI实践,可有效保障企业员工流转时,域账号及权限的全自动化管理。避免账号清理不及时潜在数据泄露风险。数据分类分级全面覆中华人民共和国网络安全法、盖GDPR、SOx、PCI Dss.HIPAA等法律法规。精细分类与脱敏内置110+分类规则,即将拓展用户自定义识别;支持哈希、遮掩、替换、变换、加密等常用脱敏算法。合规审计支持企业上市合规审计、常规内审等,基于DMS统一纳管可全方位支持人员权限、数据库变更与访问的详细流水审计。

3) 数据库DataOps能力介绍:

针对的企业痛点:有哪些规范?规范在哪里﹖不同业务的规范怎么支持﹖如何保障规范的生效﹖研发效率怎么提升?

DMS数据库DataOps研发流程:

准备阶段:元数据自动采集、设计规范配置、研发流程配置、审批流程配置。

开发阶段:表结构设计、自助查询变更、SQL审核优化、测试环境构建。

发布阶段:无锁变更、研发规范监测并拦截、流程审批、变更异常回滚。

丰富数据源:

支持27种数据源,包括OLTP/OLAP/NoSQL/对象存储/数据湖;支持跨IDC、云厂商数据源的统一管理。

稳定可控:

通过无锁变更、变更前备份及变更异常自动回滚等策略保障开发过程中,数据库稳定可控。

安全可信:

内置阿里巴巴最新研发规范,规避无主键等不合理设计带来潜在风险;目前支持200+设计及审核规范,可按需调整。

敏捷高效:

基于设计规范,研发人员全自助即可完成合规的数据库开发,非生产环境可做到免审批,仅生产环境需要审核。保障安全的同时,实现高效协同。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
相关文章
|
9月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
7月前
|
数据可视化 BI API
无缝对接云数据库:自定义报表生成工具在混合云环境下的部署指南
自定义报表生成工具通过拖拽设计、多数据源整合及自动化输出,帮助业务人员零代码创建个性化报表,解决传统工具灵活性不足、技术门槛高的问题。文章对比其与传统报表差异,列举行业应用场景(如财务、零售),并给出选型建议与主流工具(如FineReport、Power BI、板栗看板)的优劣势分析。
282 0
|
5月前
|
人工智能 数据库 iOS开发
DBeaver Ultimate Edtion 25.2 发布 - 通用数据库工具
DBeaver Ultimate Edtion 25.2 Multilingual (macOS, Linux, Windows) - 通用数据库工具
601 0
|
7月前
|
SQL 存储 数据库
SQL Server Management Studio (SSMS) 21 - 微软数据库管理工具
SQL Server Management Studio (SSMS) 21 - 微软数据库管理工具
1207 0
|
8月前
|
存储 关系型数据库 数据库
高性能云盘:一文解析RDS数据库存储架构升级
性能、成本、弹性,是客户实际使用数据库过程中关注的三个重要方面。RDS业界率先推出的高性能云盘(原通用云盘),是PaaS层和IaaS层的深度融合的技术最佳实践,通过使用不同的存储介质,为客户提供同时满足低成本、低延迟、高持久性的体验。
|
8月前
|
存储 人工智能 前端开发
Google揭秘Agent架构三大核心:工具、模型与编排层实战指南
本文为Google发布的Agent白皮书全文翻译。本文揭示了智能体如何突破传统AI边界,通过模型、工具与编排层的三位一体架构,实现自主推理与现实交互。它不仅详解了ReAct、思维树等认知框架的运作逻辑,更通过航班预订、旅行规划等案例,展示了智能体如何调用Extensions、Functions和Data Stores,将抽象指令转化为真实世界操作。文中提出的“智能体链式组合”概念,预示了未来多智能体协作解决复杂问题的革命性潜力——这不仅是技术升级,更是AI赋能产业的范式颠覆。
2545 1
|
9月前
|
存储 Cloud Native 关系型数据库
PolarDB开源:云原生数据库的架构革命
本文围绕开源核心价值、社区运营实践和技术演进路线展开。首先解读存算分离架构的三大突破,包括基于RDMA的分布式存储、计算节点扩展及存储池扩容机制,并强调与MySQL的高兼容性。其次分享阿里巴巴开源治理模式,涵盖技术决策、版本发布和贡献者成长体系,同时展示企业应用案例。最后展望技术路线图,如3.0版本的多写多读架构、智能调优引擎等特性,以及开发者生态建设举措,推荐使用PolarDB-Operator实现高效部署。
449 4
|
9月前
|
人工智能 监控 前端开发
基于 Next.js 的书法字体生成工具架构设计与 SSR 优化实践
本项目是一款书法字体生成工具,采用 Next.js 14(App Router)与 Tailwind CSS 构建前端,阿里云 Serverless 部署后端。通过混合渲染策略(SSG/SSR/CSR)、Web Worker 异步计算及 CDN 字体分片加载优化性能。服务端借助阿里云函数计算处理计算密集型任务,将平均耗时从 1200ms 降至 280ms,支持 1000+ QPS。动态路由与 ARMS 监控提升工程化水平,未来计划引入 WebGPU 和 AI 字体风格迁移技术,进一步优化用户体验。
|
5月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
436 158
|
5月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。