【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1|学习笔记(一)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 快速学习【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1

开发者学堂课程【数据仓库 ACP 认证课程【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/928/detail/14623


【视频】云原生数据仓库 AnalyticDB MySQL 版 _解析与实践1

 

内容介绍:

一、课程目标

二、产品概述

三、产品架构及原理

四、产品相关概念

五、核心功能解析与实践

 

一、课程目标

1.了解云原生数据仓库 AnalyticDB MySQL 版的产品特性、架构、技术特点

2.掌握数据仓库相关概念及核心技术

 

二、产品概述

1.产品简介

云原生数据仓库 AnalyticDB MySQL 版(ADB MySQL )是融合数据库、大数据技术于一体的云原生企业级数据仓库服务。支持高吞吐的数据实时增删改、低延时的实时分析和复杂ETL,兼容上下游生态工具,可用于构建企业级报表系统、数据仓库和数据服务引擎。

云原生可以用两个方面介绍:云、原生

云计算也是一个重要的趋势,应用系统上应用非常的多,原声指的是系统从设计之初就考虑了云的这样一个基础架构。那所谓的云原生系统其实主要的优势是利用了云计算的这个分布式和弹性能力

MySQL 是分析型数据库

整个ADB MySQL 结合了这个数据库的应用性以及大数据的对大规模数据的处理能力的一款产品,那通过这个融合数据库,可以更方便的应用这个产品。

融合了大数据技术,传统的数据库虽然对日常业务处理是没有问题的,但是对于更大规模的数据的实时分析,还会带来很多问题。他们是融合这个大数据基础,即很多大数据的内容可以通过这款产品来实现,

ADB MySQL 是支持高吞吐的数据的实时通查、改查和低延时的实时分析以及复杂的 BI兼容上下游生态工具。

可用于构建企业级报表系统和数据仓库和数据服务引擎,它的一个口号是我们会用数据库,就会用大数据。基于大数据技术的数据库,主要包括六个方面的特征

image.png

①兼容&超越 MySQL

MySQL兼容99%

ANSI sQL:2013复杂分析支持

②完善的生态

20+BI工具

oLTP+NoSQL无缝实时同步

③存储计算分离架构提供极致性价比

存储、计算Serverless;高可用99.99%

存储从G8至100PB,计算从3到5000节点

④一套存储支持实时写入、点查、多维分析多场录

行列混存+RAFT复制支持每秒千万级实时增删改查以及多维分析

智能索引技术支持任意维度组合分析(eg.Pinot/ElasticSearch)

⑤完备的企业级特性

备份/Flashback/回收站

事计/自建账号八VPC

⑥MPP+DAG融合计算引擎实现数据库与大数据一体化

CBO+CodeGen +智能混合负戟实现在离线一体化

AI扩展+向量检素实现结构化/非结构化数据联合分析

2.产品定位

云原生数据仓库AnalyticDB MySQL版为企业级客户提供数据处理ETL、实时在线分析、核心报表、大屏和监控能力,提供稳定的离线和在线数据服务。

(1)事务数据库(RDS/MYSQL/ORACLE )

数据量:小于1TB的事务为主

使用成本∶分析类功能不齐全

超过1TB分析性能慢

(2)AnalyticDB for MysQL

数据量:1T-10PB

使用成本:SQL、数据库习惯

数据实时、高并发

(3)大数据系统( Hadoop/Spark)

数据量>10PB

使用成本:部署复杂、使用成本高

不支持数据实时、并发低

事务数据库用户,数据小于1TB,分析功能和性能无法满足中小传统企业,数据量小于10PB,大数据部署成本高,使用复杂互联网数据类产品,例如电商卖家数据大盘等,要求高并发

定位:简单易用的 PB 级实时数据仓库

3.产品特点和优势

(1)资源弹性

采用存储计算分离架构,支持存储计算资源在线扩缩容,支持GB到PB数据规模实时计算。

(2)高性能

支持海量数据亳秒/秒级实时多维分析查询,支持数据实时高并发写入,数据实时更新立即可见。

新一代高性能、高可用、高性价比的企业级云原生数据仓库

(3)低成本

支持资源分时弹性、冷热数据分层、资源组隔离等功能,计算资源和存储资源成本大幅降低。支持按量计费,单GB存储成本低至0.144元/月。

(4)高可用

采用分布式技术架构,保障服务稳定高可用运行;通过阿里云云盘多副本机制实现数据可靠性保证。

4.产品核心功能

(1)分时弹性

支持按小时设置计算资源弹性扩容规则,解决计算资源峰谷需求问题,降低计算资源成本。

白天查询业务高峰

白天工作高峰期,准时弹出计算资源,让业务查询更快,提高应用体验。

晚上ETL计算高峰

晚上ETL高峰期,准时弹出计算资源,让ETL计算任务稳定运行,低峰期准时释放,降低资源成本。

image.png8:30到下午10:30是一个业务高峰期,负载达到了70%,QPS是400,RT 是440毫秒,可以通过这样一个分析弹性,根据我们的业务需求,在早晨8:30将计算资源进行扩容,从原来的64核呃扩展到256核,保证这个业务高峰期的一个平稳运行,到11:30以后,可以释放资源,回到满足正常日常业务的需求。通过分析弹性可以有效的降低计算资源的成本

(2)冷热数据分层

支持数据在表和分区级别分为热数据和冷数据,热数据存储在高性能介质,加快查询计算速度﹔冷数据存储在便宜的HDD介质上,节约存储成本。

冷热数据设置

在建表语句中设置表和分区的冷热属性,数据分别写入到对应的介质。冷热数据切换

可以随时修改表和分区的冷热属性,系统自动进行数据搬迁。

热数据(On ESSD)

场景:在线分析、要求并发和高性能

温数据(ESSD+OSS混合)

场景:在离线混合分析,平衡型

冷数据(On OSS)

场景:离线分析、追求低成本

image.png

三、产品架构及原理

1.产品架构

AnalyticDB MySQL版采用云原生架构,计算存储分离、冷热数据分离,支持高吞吐实时写入和数据强一致,兼顾高并发查询和大吞吐批处理的混合负载。

 image.png

(1)接入层

协议层接入、SQL解析和优化、数据和查询调度

(2)计算引擎

支持高并发和复杂SQL混合负载

弹性调度,可根据业务需求做到分钟级甚至秒级扩展,实现了资源的有效利用。

(3)存储引擎

分布式实时强一致高可用存储引擎

利用分层存储实现冷热分离降低成本

通过行列存储和智能索引提升性能

2.优化器介绍 

image.png从低向上包括四个层次:统计层、代价估算层、优化层、缓存层

统计信息:提供多样的统计信息;提供自动的统计信息收集;提供动态采样;

代价预估和代价模型;

基于规则的RBO框架和基于代价的CBO框架;

通过缓存来提供优化器的高效性

可介入、可运维。

3. 弹性计算层介绍

(1)弹性计算层:架构

image.png计算引擎采用弹性计算引擎,支持资源组,资源组1支持在线查询,资源组2支持ETL查询,弹性计算层可以支持弹性扩容,可以应对大规模的ETL查询,具有分式弹性的特征

相关实践学习
数据库实验室挑战任务-初级任务
本场景介绍如何开通属于你的免费云数据库,在RDS-MySQL中完成对学生成绩的详情查询,执行指定类型SQL。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
11天前
|
存储 关系型数据库 MySQL
【面试宝藏】MySQL 面试题解析
MySQL面试题解析涵盖数据库范式、权限系统、Binlog格式、存储引擎对比、索引原理及优缺点、锁类型、事务隔离级别等。重点讨论了InnoDB与MyISAM的区别,如事务支持、外键和锁机制。此外,还提到了Unix时间戳与MySQL日期时间的转换,以及创建索引的策略。
25 4
|
25天前
|
边缘计算 Cloud Native 数据管理
【阿里云云原生专栏】云原生背景下的AIoT布局:阿里云Link平台解析
【5月更文挑战第29天】阿里云Link平台,作为阿里云在AIoT领域的核心战略,借助云原生技术,为开发者打造一站式物联网服务平台。平台支持多协议设备接入与标准化管理,提供高效数据存储、分析及可视化,集成边缘计算实现低延时智能分析。通过实例代码展示,平台简化设备接入,助力智能家居等领域的创新应用,赋能开发者构建智能生态系统。
121 3
|
1月前
|
SQL Kubernetes 关系型数据库
实时计算 Flink版产品使用合集之怎么解析 MySQL DDL 语句
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
18天前
|
Prometheus 监控 关系型数据库
数据库同步革命:MySQL GTID模式下主从配置的全面解析
数据库同步革命:MySQL GTID模式下主从配置的全面解析
73 0
|
11天前
|
监控 Cloud Native 持续交付
云原生架构:从理念到实践的全面解析
云原生架构已经成为现代软件开发和部署的核心理念。它不仅改变了传统的软件开发模式,还为企业提供了更高的灵活性、可扩展性和可靠性。本篇文章将深入探讨云原生架构的基本概念、关键组件以及实际应用案例,帮助读者更好地理解和应用这一先进的技术框架。
74 3
|
18天前
|
安全 关系型数据库 MySQL
深入解析MySQL 8中的角色与用户管理
深入解析MySQL 8中的角色与用户管理
25 3
|
25天前
|
域名解析 Kubernetes 网络协议
【域名解析DNS专栏】云原生环境下的DNS服务:Kubernetes中的DNS解析
【5月更文挑战第29天】本文探讨了Kubernetes中的DNS解析机制,解释了DNS如何将服务名转换为网络地址,促进集群内服务通信。Kubernetes使用kube-dns或CoreDNS作为内置DNS服务器,每个Service自动分配Cluster IP和DNS条目。通过示例展示了创建Service和使用DNS访问的流程,并提出了优化DNS解析的策略,包括使用高性能DNS解析器、启用DNS缓存及监控日志,以实现更高效、可靠的DNS服务。
|
1月前
|
存储 弹性计算 Kubernetes
【阿里云云原生专栏】深入解析阿里云Kubernetes服务ACK:企业级容器编排实战
【5月更文挑战第20天】阿里云ACK是高性能的Kubernetes服务,基于开源Kubernetes并融合VPC、SLB等云资源。它提供强大的集群管理、无缝兼容Kubernetes API、弹性伸缩、安全隔离及监控日志功能。用户可通过控制台或kubectl轻松创建和部署应用,如Nginx。此外,ACK支持自动扩缩容、服务发现、负载均衡和持久化存储。多重安全保障和集成监控使其成为企业云原生环境的理想选择。
221 3
|
1月前
|
XML Java 数据库
【后台开发】TinyWebser学习笔记(3)HTTP连接与解析
【后台开发】TinyWebser学习笔记(3)HTTP连接与解析
26 4
|
18天前
|
安全 关系型数据库 MySQL
MySQL权限管理大揭秘:用户、组、权限解析
MySQL权限管理大揭秘:用户、组、权限解析
26 0

热门文章

最新文章

推荐镜像

更多