【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1|学习笔记(一)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
全局流量管理 GTM,标准版 1个月
简介: 快速学习【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1

开发者学堂课程【数据仓库 ACP 认证课程【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/928/detail/14623


【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1

 

内容介绍:

一、课程目标

二、产品概述

三、产品架构及原理

四、产品相关概念

五、核心功能解析与实践

 

一、课程目标

1.了解云原生数据仓库 AnalyticDB MySQL 版的产品特性、架构、技术特点

2.掌握数据仓库相关概念及核心技术

 

二、产品概述

1.产品简介

云原生数据仓库 AnalyticDB MySQL 版(ADB MySQL )是融合数据库、大数据技术于一体的云原生企业级数据仓库服务。支持高吞吐的数据实时增删改、低延时的实时分析和复杂ETL,兼容上下游生态工具,可用于构建企业级报表系统、数据仓库和数据服务引擎。

云原生可以用两个方面介绍:云、原生

云计算也是一个重要的趋势,应用系统上应用非常的多,原声指的是系统从设计之初就考虑了云的这样一个基础架构。那所谓的云原生系统其实主要的优势是利用了云计算的这个分布式和弹性能力

MySQL 是分析型数据库

整个ADB MySQL 结合了这个数据库的应用性以及大数据的对大规模数据的处理能力的一款产品,那通过这个融合数据库,可以更方便的应用这个产品。

融合了大数据技术,传统的数据库虽然对日常业务处理是没有问题的,但是对于更大规模的数据的实时分析,还会带来很多问题。他们是融合这个大数据基础,即很多大数据的内容可以通过这款产品来实现,

ADB MySQL 是支持高吞吐的数据的实时通查、改查和低延时的实时分析以及复杂的 BI兼容上下游生态工具。

可用于构建企业级报表系统和数据仓库和数据服务引擎,它的一个口号是我们会用数据库,就会用大数据。基于大数据技术的数据库,主要包括六个方面的特征

image.png

①兼容&超越 MySQL

MySQL兼容99%

ANSI sQL:2013复杂分析支持

②完善的生态

20+BI工具

oLTP+NoSQL无缝实时同步

③存储计算分离架构提供极致性价比

存储、计算Serverless;高可用99.99%

存储从G8至100PB,计算从3到5000节点

④一套存储支持实时写入、点查、多维分析多场录

行列混存+RAFT复制支持每秒千万级实时增删改查以及多维分析

智能索引技术支持任意维度组合分析(eg.Pinot/ElasticSearch)

⑤完备的企业级特性

备份/Flashback/回收站

事计/自建账号八VPC

⑥MPP+DAG融合计算引擎实现数据库与大数据一体化

CBO+CodeGen +智能混合负戟实现在离线一体化

AI扩展+向量检素实现结构化/非结构化数据联合分析

2.产品定位

云原生数据仓库AnalyticDB MySQL版为企业级客户提供数据处理ETL、实时在线分析、核心报表、大屏和监控能力,提供稳定的离线和在线数据服务。

(1)事务数据库(RDS/MYSQL/ORACLE )

数据量:小于1TB的事务为主

使用成本∶分析类功能不齐全

超过1TB分析性能慢

(2)AnalyticDB for MysQL

数据量:1T-10PB

使用成本:SQL、数据库习惯

数据实时、高并发

(3)大数据系统( Hadoop/Spark)

数据量>10PB

使用成本:部署复杂、使用成本高

不支持数据实时、并发低

事务数据库用户,数据小于1TB,分析功能和性能无法满足中小传统企业,数据量小于10PB,大数据部署成本高,使用复杂互联网数据类产品,例如电商卖家数据大盘等,要求高并发

定位:简单易用的 PB 级实时数据仓库

3.产品特点和优势

(1)资源弹性

采用存储计算分离架构,支持存储计算资源在线扩缩容,支持GB到PB数据规模实时计算。

(2)高性能

支持海量数据亳秒/秒级实时多维分析查询,支持数据实时高并发写入,数据实时更新立即可见。

新一代高性能、高可用、高性价比的企业级云原生数据仓库

(3)低成本

支持资源分时弹性、冷热数据分层、资源组隔离等功能,计算资源和存储资源成本大幅降低。支持按量计费,单GB存储成本低至0.144元/月。

(4)高可用

采用分布式技术架构,保障服务稳定高可用运行;通过阿里云云盘多副本机制实现数据可靠性保证。

4.产品核心功能

(1)分时弹性

支持按小时设置计算资源弹性扩容规则,解决计算资源峰谷需求问题,降低计算资源成本。

白天查询业务高峰

白天工作高峰期,准时弹出计算资源,让业务查询更快,提高应用体验。

晚上ETL计算高峰

晚上ETL高峰期,准时弹出计算资源,让ETL计算任务稳定运行,低峰期准时释放,降低资源成本。

image.png8:30到下午10:30是一个业务高峰期,负载达到了70%,QPS是400,RT 是440毫秒,可以通过这样一个分析弹性,根据我们的业务需求,在早晨8:30将计算资源进行扩容,从原来的64核呃扩展到256核,保证这个业务高峰期的一个平稳运行,到11:30以后,可以释放资源,回到满足正常日常业务的需求。通过分析弹性可以有效的降低计算资源的成本

(2)冷热数据分层

支持数据在表和分区级别分为热数据和冷数据,热数据存储在高性能介质,加快查询计算速度﹔冷数据存储在便宜的HDD介质上,节约存储成本。

冷热数据设置

在建表语句中设置表和分区的冷热属性,数据分别写入到对应的介质。冷热数据切换

可以随时修改表和分区的冷热属性,系统自动进行数据搬迁。

热数据(On ESSD)

场景:在线分析、要求并发和高性能

温数据(ESSD+OSS混合)

场景:在离线混合分析,平衡型

冷数据(On OSS)

场景:离线分析、追求低成本

image.png

三、产品架构及原理

1.产品架构

AnalyticDB MySQL版采用云原生架构,计算存储分离、冷热数据分离,支持高吞吐实时写入和数据强一致,兼顾高并发查询和大吞吐批处理的混合负载。

 image.png

(1)接入层

协议层接入、SQL解析和优化、数据和查询调度

(2)计算引擎

支持高并发和复杂SQL混合负载

弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

(3)存储引擎

分布式实时强一致高可用存储引擎

利用分层存储实现冷热分离降低成本

通过行列存储和智能索引提升性能

2.优化器介绍 

image.png从低向上包括四个层次:统计层、代价估算层、优化层、缓存层

统计信息:提供多样的统计信息;提供自动的统计信息收集;提供动态采样;

代价预估和代价模型;

基于规则的RBO框架和基于代价的CBO框架;

通过缓存来提供优化器的高效性

可介入、可运维。

3. 弹性计算层介绍

(1)弹性计算层:架构

image.png计算引擎采用弹性计算引擎,支持资源组,资源组1支持在线查询,资源组2支持ETL查询,弹性计算层可以支持弹性扩容,可以应对大规模的ETL查询,具有分式弹性的特征

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
2月前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
344 9
|
24天前
|
存储 分布式计算 大数据
大数据揭秘:从数据湖到数据仓库的全面解析
大数据揭秘:从数据湖到数据仓库的全面解析
71 19
|
30天前
|
存储 人工智能 Cloud Native
NAS深度解析:面向云原生应用的文件存储
本文深入解析了面向云原生应用的文件存储NAS,由阿里云专家分享。内容涵盖Cloud Native与AI浪潮下的技术创新,包括高性能、弹性伸缩、成本优化及数据安全等方面。针对云原生应用的特点,NAS在Serverless生态中不断演进,提供多种产品规格以满足不同需求,如极速型NAS、归档存储等,确保用户在高并发场景下获得稳定低延时的存储体验。同时,通过优化挂载参数和容器访问策略,提升整体性能与可用性。
49 11
|
2月前
|
存储 关系型数据库 MySQL
double ,FLOAT还是double(m,n)--深入解析MySQL数据库中双精度浮点数的使用
本文探讨了在MySQL中使用`float`和`double`时指定精度和刻度的影响。对于`float`,指定精度会影响存储大小:0-23位使用4字节单精度存储,24-53位使用8字节双精度存储。而对于`double`,指定精度和刻度对存储空间没有影响,但可以限制数值的输入范围,提高数据的规范性和业务意义。从性能角度看,`float`和`double`的区别不大,但在存储空间和数据输入方面,指定精度和刻度有助于优化和约束。
332 5
|
3月前
|
存储 Cloud Native 块存储
EBS深度解析:云原生时代企业级块存储
企业上云的策略,从 Cloud-Hosting 转向 Serverless 架构。块存储作为企业应用上云的核心存储产品,将通过 Serverless 化来加速新的计算范式全面落地。在本话题中,我们将会介绍阿里云块存储企业级能力的创新,深入解析背后的技术细节,分享对未来趋势的判断。
267 2
|
3月前
|
监控 关系型数据库 MySQL
MySQL自增ID耗尽应对策略:技术解决方案全解析
在数据库管理中,MySQL的自增ID(AUTO_INCREMENT)属性为表中的每一行提供了一个唯一的标识符。然而,当自增ID达到其最大值时,如何处理这一情况成为了数据库管理员和开发者必须面对的问题。本文将探讨MySQL自增ID耗尽的原因、影响以及有效的应对策略。
238 3
|
3月前
|
Kubernetes Cloud Native 云计算
云原生技术深度解析:重塑企业IT架构的未来####
本文深入探讨了云原生技术的核心理念、关键技术组件及其对企业IT架构转型的深远影响。通过剖析Kubernetes、微服务、容器化等核心技术,本文揭示了云原生如何提升应用的灵活性、可扩展性和可维护性,助力企业在数字化转型中保持领先地位。 ####
|
3月前
|
存储 关系型数据库 MySQL
MySQL 字段类型深度解析:VARCHAR(50) 与 VARCHAR(500) 的差异
在MySQL数据库中,`VARCHAR`类型是一种非常灵活的字符串存储类型,它允许存储可变长度的字符串。然而,`VARCHAR(50)`和`VARCHAR(500)`之间的差异不仅仅是长度的不同,它们在存储效率、性能和使用场景上也有所不同。本文将深入探讨这两种字段类型的区别及其对数据库设计的影响。
150 2
|
3月前
|
运维 Kubernetes Cloud Native
Kubernetes云原生架构深度解析与实践指南####
本文深入探讨了Kubernetes作为领先的云原生应用编排平台,其设计理念、核心组件及高级特性。通过剖析Kubernetes的工作原理,结合具体案例分析,为读者呈现如何在实际项目中高效部署、管理和扩展容器化应用的策略与技巧。文章还涵盖了服务发现、负载均衡、配置管理、自动化伸缩等关键议题,旨在帮助开发者和运维人员掌握利用Kubernetes构建健壮、可伸缩的云原生生态系统的能力。 ####
|
3月前
|
存储 关系型数据库 MySQL
PHP与MySQL动态网站开发深度解析####
本文作为技术性文章,深入探讨了PHP与MySQL结合在动态网站开发中的应用实践,从环境搭建到具体案例实现,旨在为开发者提供一套详尽的实战指南。不同于常规摘要仅概述内容,本文将以“手把手”的教学方式,引导读者逐步构建一个功能完备的动态网站,涵盖前端用户界面设计、后端逻辑处理及数据库高效管理等关键环节,确保读者能够全面掌握PHP与MySQL在动态网站开发中的精髓。 ####

热门文章

最新文章

推荐镜像

更多