云原生数据仓库AnalyticDB MySQL版/PostgreSQL版(一)

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 云原生数据仓库AnalyticDB MySQL版/PostgreSQL版(一)

开发者学习笔记【阿里云云数据库助理工程师(ACA)认证云原生数据仓库AnalyticDB MySQL版/PostgreSQL版(一)

课程地址https://edu.aliyun.com/course/3112080/lesson/19084

 

云原生数据仓库AnalyticDB MySQL版/PostgreSQL版(一)


课程目标:

1、了解阿里云原生数据仓库  AnalyticDB  产品特性。

2掌握产品基本技术原理和应用场景。

 

内容介绍

一、包括数据仓库的技术趋势

二、AnalyticDB  产品特

三、AnalyticDB  场景案例

 

一、 数据仓库领域技术趋势

 

图片100.png如上图,在数据仓库领域,当今的技术趋势是原生、湖仓一体和数据库大数据一体化。

主要表现在采用原生的技术架构,支持全量数据集中在统一的平台,支持数据的实时更新、实时计算。


云原生数据仓库是近年热点

从市场上来讲,云原生数据仓库的市场也是在迅猛发展,每年有数十亿美元的市场空间。去年Snowfiake上市,创造了市值超过700亿美金的奇迹,如下图:

图片101.png

 全球云源生数据仓库的主要服务商包括:Redsjift Snowflake、BigQuery、Azure Synapse Analytics、阿里云 AnalyticDB


阿里云原生数据仓库的整体架构

如下图所示: 

图片102.png

 AnalyticDB简称ADB,分为MYSQL版和PG版。用户可根据自己的数据情况以及开发用的技术背景,选择其中一版本。用户可以基于AnalyticDB统一数据存储、计算的平台。支持企业全网数据的实时同步更新、实时计算和实时服务。这样极大的简化整个仓的技术架构。可以通过云上的DTS等等同步工具,实时将数据源中的数据统一到AnalyticDB里。


云上的主要数据源包括关系数据库、MySQL数据库以及OSS等等。同时可以通过DMS it works等等数据管理和开发工具进行ETL任务的开发、调度、统一管理、运维进行数据资源管理。在数据业务层面,可以支持QuickBI、Tableauf、FineBI等等常见的BI工具。可支持用户自助开发的这种数据产品的数据工具平台。

 

二、 AnalyticDB  产品特性


图片103.png

主要特如下

nalyticDB MySQL  它是基于原生的技术架构采用容器技术进行轻量化的部署,用户间的集群资源隔离独享支持全球化部署。更兼容  MySQL 协议最多可以支持250个数据库支持支。

数据库的数据实时更新,实时删除兼容MySQL的权限体系。它支持云原生的弹性扩容,存储空间可从GB级扩展到PB级别存储计算分离,按量计费弹性计算节点

最新的弹性版本性能得到大幅提升。在TBC-DS标准测试级的性能测试里面排名全球第一它同时具备数据库的很多优良特性,还基于Raft 协议,保证数据的强一致,数据写入过后立即可见,实时可查。支持ETL计算的ACLD的能力。AnalyticDB中的数据具有非常高的可靠性,默认提供三副本的存储。提供,每周两次的全量备份,加上日志的实时备份可进行任意时间点的数据恢复。

 图片104.png

 如上图:

2020年11月份发布的弹性模式新增了很多企业级的核心功能。


它实现了存储计算分离的架构,可以根据业务特点和负载的特点,针对性的优化计算资源和存储资源降低扩容成本。其次,他支持资源的分式弹性可按时间段编排计算资源按实际使用量计费降低了计算资源的成本支持资源组隔离。


可以将稳定的业务放在一个资源组把临时的或者开发中的任务放在其他的资源组,可以保证核心计算任务的稳定运行不受临时和异常情况的影响。它支持冷热数据分层


可以将对于性能要求高的热数据存储在高性能介质里面。将低频访问的数据存储在廉价的存储介质里面。如此既能保证热数据的高性能的访问同时又能极大的降低数据存储成本,最多可以降低90%。

 MYSQL版的数据模型如下

 图片105.png

最上面一层和集群这种级别由若干台器构成一个集群,我们叫做一个实例。

在实例下面是数据库级别。它一个集群最多可支持256个逻辑数据库。用权限隔离和表空间的管理。数据库下面是表,表可以分为普通表、维度表普通表又称分布式表用来存储明细数据的可以通过指定分布键,将数据分布到多台机器。


同时也支持维度表又成广播表,他会在每个节点冗余一份,从而达到加速关联计算速度的目的。表下面是分片在建表的时候,通过指定分布键将数据分成多个指标分布到若干机器,一个分片也叫一个Shard。在分片下面还可以指定一个字段进行进行分区。


可以通过数据分区,指定分区的生命周期功能可以实现两数据的分成,加上数据的生命周期淘汰的功能。

图片106.png

 AnalyticDB PG版 兼容PostgreSQL生态,高度兼容Oracle语法生态,它基于MPP水平扩展架构,支持PB级数据查询秒级响应。支持存储过程、窗口、函数、触发器、视图等等数据库的常见功能也支持很多的机器学习的算法可以支持向量检索和以图收图等等

图片107.png

 如上图:AnalyticDB PostgreSQL实现了HA高可用架构支持分布式事务。数据本地商户本存储可以实现高吞吐的数据导入和导出。可以进行计算节点的任意水平扩展。

图片108.png

如上图:对数据表来说,还可定义按传统行式数据存储或者按列式数据存储对于高并发的检查场景适合用航程。对于大批量数据加载和全表的扫描聚合计算。这种适合列式数据储存。

AnalyticDB PostgreSQL版弹性扩展,如下图:

图片109.png

在线扩容,增加MPP集群的节点可自动进行数据的重新分布,可以不中断业务查询。

AnalyticDB PostgreSQL特点是支持丰富的函数支持存储过程,支持用户自定义的自定义函数。如图:

图片110.png

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
4月前
|
数据采集 运维 Cloud Native
Flink+Paimon在阿里云大数据云原生运维数仓的实践
构建实时云原生运维数仓以提升大数据集群的运维能力,采用 Flink+Paimon 方案,解决资源审计、拓扑及趋势分析需求。
18507 54
Flink+Paimon在阿里云大数据云原生运维数仓的实践
|
4月前
|
存储 数据挖掘 BI
数据仓库深度解析与实时数仓应用案例探析
随着数据量的不断增长和数据应用的广泛深入,数据治理和隐私保护将成为数据仓库建设的重要议题。企业需要建立完善的数据治理体系,确保数据的准确性、一致性和完整性;同时加强隐私保护机制建设,确保敏感数据的安全性和合规性。
517 55
|
3月前
|
消息中间件 存储 大数据
大数据-数据仓库-实时数仓架构分析
大数据-数据仓库-实时数仓架构分析
137 1
|
3月前
|
存储 运维 Cloud Native
"Flink+Paimon:阿里云大数据云原生运维数仓的创新实践,引领实时数据处理新纪元"
【8月更文挑战第2天】Flink+Paimon在阿里云大数据云原生运维数仓的实践
277 3
|
5月前
|
Cloud Native 数据管理 OLAP
云原生数据仓库AnalyticDB产品使用合集之是否可以创建表而不使用分区
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
407 2
云原生数据仓库AnalyticDB产品使用合集之是否可以创建表而不使用分区
|
5月前
|
Cloud Native 关系型数据库 MySQL
《阿里云产品四月刊》—云原生数据仓库 AnalyticDB MySQL 版 新功能
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
101 3
|
4月前
|
存储 消息中间件 数据挖掘
数据仓库的深度探索与实时数仓应用案例解析
大数据技术的发展,使得数据仓库能够支持大量和复杂数据类型(如文本、图像、视频、音频等)。数据湖作为一种新的数据存储架构,强调原始数据的全面保留和灵活访问,与数据仓库形成互补,共同支持企业的数据分析需求。
|
5月前
|
SQL Cloud Native 关系型数据库
云原生数据仓库AnalyticDB操作报错合集之执行sql的进程报错:"unknown connection id",是什么导致的
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
792 3
|
5月前
|
SQL Cloud Native 关系型数据库
云原生数据仓库AnalyticDB操作报错合集之报错代码"[31004, 2023121817001319216817200303151051107] : Compiler failed and interpreter is disabled"是什么导致的
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
725 3
|
1月前
|
人工智能 自然语言处理 关系型数据库
阿里云云原生数据仓库 AnalyticDB PostgreSQL 版已完成和开源LLMOps平台Dify官方集成
近日,阿里云云原生数据仓库 AnalyticDB PostgreSQL 版已完成和开源LLMOps平台Dify官方集成。

热门文章

最新文章

相关产品

  • 云原生数据仓库AnalyticDB MySQL版