《阿里云认证的解析与实战-数据仓库ACP认证》——云原生数据仓库AnalyticDB PostgreSQL版解析与实践(上)——一、产品概述

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
云解析 DNS,旗舰版 1个月
简介: 《阿里云认证的解析与实战-数据仓库ACP认证》——云原生数据仓库AnalyticDB PostgreSQL版解析与实践(上)——一、产品概述

1. 产品简介

 

云原生数据仓库AnalyticDB PostgreSQL版ADB PG是阿里云自研高性能、海量扩展数据仓库服务,兼容部分Oracle/Teradata语法生态,应用于阿里巴巴集团内部电商、物流、文娱、广告等业务部门,服务于阿里云的金融、政企、互联网等各行业用户,支持快速构建新一代云化数据仓库服务。

 

PB级数据实时响应能:MPP水平扩展架构,PB级数据查询秒级响应;向量化计算,及列存储智能索引,领先传统数据库引擎性能3x;新一代SQL优化器,实现复杂分析语句免调优。

稳定可靠、简化运维:飞天平台基于阿里多年大规模集群系统构筑经验打造,智能硬件管理,故障监控诊断自恢复,支持MPP数据库实现复杂集群系统高可靠,自运维。

SQL兼容性:可支持SQL 2003,部分兼容Oracle语法,支持PL/SQL存储过程,OLAP窗口函数,视图等,完备功能和生态,实现应用快速适配、或迁移。

数据多模分析:通过PostGIS插件支持地理信息数据分析;内置100+机器学习算法库,实现数据智能探索;高性能向量检索算法,支持视频/图像检索以图搜图。

 

 

2. 发展历程

 

2017年,ADB PG(原HDB)诞生,内核PG 8.2。

2018年,ORCA优化器稀疏和聚簇索引,支持JSON数据类型OSS外表。

2019年,内核升级PG9.4,向量执行引擎1.0多MASTER,RBO优化器增强,支持高维向量检索,通过信通院&信创认证。

2020年,云原生升级,备份恢复能力增强包含物理备份和表逻辑备份,外表联邦分析,多维排序,向量执行引擎,通过TPC-H评测获得全球第一。

2021年,副本多活、分层存储、计算存储分离、HTAP增强、行列混存。

 

3. 产品定位

 

ADB PG兼容业内主流数仓架构方案,支持ETL离线处理,支持在线交互分析。通过高性能计算引擎及实时同步方案,支持在线数据随机探索,实时同步分析。

 

如图

RDS MySQL可以通过DTS入库。

流式计算Kafka/Flink可以通过Copy/Insert方式入库。

批量加载可以通过第三方工具Kettle/DSG。

OSS/MaxCompute可以通过Dataworks数据集成或者外表的方式导入。

数据开发作业调度支持DMS、Dataworks、Dataphin。

 

image.png

 

功能完备:基于PostgreSQL内核,SQL高度兼容Teradata/Oracle。

生态完备:与阿里云数仓开发平台Dataworks,数据中台Dataphin,数据同步工具DTS等无缝集成;支持业内主流第三方工具。

 

4. 产品特点和优势

 

性能强劲:TPC-H评测全球第一,超过90%的读写性能水平扩展比。

弹性:支持水平扩容,分布式弹性架构,PB级数据存储与分析。

遵循PG/GP:业界最主流数仓协议,兼容主流ETL/BI/可视化等生态工具。

简单易用:经历大规模验证,对标传统商业数仓的企业级特性。

 

5. 核心功能

 

1) PL/pgSQL过程语言

 

自定义函数&存储过程如下:

CREATE [OR REPLACE] {FUNCTION | STORED PROCEDURE} name
([[argmode] [argname] argtype [ { DEFAULT|=} default_expr][,...]])
[RETURNS rettype
 |RETURNS TABLE ( column_name column_type [, ...]) ]
LANGUAGE langname
WINDow
IMMUTABLE | STABLE |VOLATILE | [NOT] LEAKPROOF
| CALLED ON NULL INPUT | RETURNS NULL ON NULL INPUT | STRICT
[EXTERNAL] SECURITY INVOKER | [EXTERNAL] SECURITY DEFINER
| EXECUTE ON { ANY | MASTER | ALL SEGMENTS }
| COST execution_cost
SET configuration_parameter { TO value |= value| FROM CURRENT }
As definition
As'obj file,Link symbol'...
[WITH({DESCRIBE = describe_function
 }[, ...])}

  

2) CBO优化器

 

新一代cascade框架的SQL优化器,面向全并行执行架构,代价优化CBO和规则优化RBO相结合,实现复杂SQL免调优。

 

Top-Down路径搜索框架,搜索和路径选择更全面精准,避免出现局部查询路径最优解。

子查询自动改写为分布式JOIN,实现并行计算,规避手工改写调优。

SQL优化阶段定义动态分区裁剪,即支持确定性过滤条件,也支持参数化的过滤条件,减少I/O。

 

3) 资源负载管理

 

支持自定义执行队列,根据用户角色,其执行任务进入对应资源管控队列。任务队列支持设定:

 

并行执行任务数;

CPU优先级;

内存资源上限。

 

示例

如下图,用户可以自定义三个执行队列

 

image.png

 

ETL队列:赋予资源获取最低优先级。

BI报表队列:赋予资源获取最高优先级。

数据探索队列:赋予资源获取中间优先级。

 

4) 备份恢复方式丰富

 

AnalyticDB PostgreSQL版支持如下备份特点:

 

PITR备份恢复

RPO<10min

支持差异化全量备份

支持增量备份

支持分布式一致性恢复

支持表级逻辑备份

 

image.png

 

5) 支持丰富生态

 

ADB PG支持主流工具,包括阿里云提供的DataWorks、DTS、DMS、数据集成、Quickbi、DataV等工具以及第三方Kettle、DSG等工具。

 

image.png

 

6. 产品选型

 

ADB PG产品系列有两种:预留模式和弹性模式。

 

1) 预留模式

 

特点:兼容Greenplum/PostgreSQL。支持2c、4c和8c规格,不同规格之间支持在线升降配、秒级切换,不影响业务运行,适合数据实时写入(DTS),高并发、实时分析场景。

性价比:百万TPS实时写入,上百QPS查询。

可用性:支持单副本和双副本模式,数据保存在云盘,可用性99.9%。

 

2) 弹性模式

 

特点:采用云原生架构,存储和计算完全分离,支持更大存储量,存储成本低,支持秒级扩缩容。适合批量导入、低并发,复杂ETL分析场景。

性价比:百万TPS批量导入,几十QPS复杂分析查询。

可用性:所有数据保存在OSS上,计算双副本,可用性99.9%。

 

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
15天前
|
自然语言处理 编译器 Linux
|
6天前
|
存储 Cloud Native 块存储
EBS深度解析:云原生时代企业级块存储
企业上云的策略,从 Cloud-Hosting 转向 Serverless 架构。块存储作为企业应用上云的核心存储产品,将通过 Serverless 化来加速新的计算范式全面落地。在本话题中,我们将会介绍阿里云块存储企业级能力的创新,深入解析背后的技术细节,分享对未来趋势的判断。
|
8天前
|
Kubernetes Cloud Native 云计算
云原生技术深度解析:重塑企业IT架构的未来####
本文深入探讨了云原生技术的核心理念、关键技术组件及其对企业IT架构转型的深远影响。通过剖析Kubernetes、微服务、容器化等核心技术,本文揭示了云原生如何提升应用的灵活性、可扩展性和可维护性,助力企业在数字化转型中保持领先地位。 ####
|
9天前
|
运维 Kubernetes Cloud Native
Kubernetes云原生架构深度解析与实践指南####
本文深入探讨了Kubernetes作为领先的云原生应用编排平台,其设计理念、核心组件及高级特性。通过剖析Kubernetes的工作原理,结合具体案例分析,为读者呈现如何在实际项目中高效部署、管理和扩展容器化应用的策略与技巧。文章还涵盖了服务发现、负载均衡、配置管理、自动化伸缩等关键议题,旨在帮助开发者和运维人员掌握利用Kubernetes构建健壮、可伸缩的云原生生态系统的能力。 ####
|
14天前
|
Kubernetes Cloud Native 调度
云原生批量任务编排引擎Argo Workflows发布3.6,一文解析关键新特性
Argo Workflows是CNCF毕业项目,最受欢迎的云原生工作流引擎,专为Kubernetes上编排批量任务而设计,本文主要对最新发布的Argo Workflows 3.6版本的关键新特性做一个深入的解析。
|
16天前
|
监控 Cloud Native 持续交付
云原生技术深度解析:重塑现代应用开发与部署范式####
本文深入探讨了云原生技术的核心概念、关键技术组件及其在现代软件开发中的重要性。通过剖析容器化、微服务架构、持续集成/持续部署(CI/CD)等关键技术,本文旨在揭示云原生技术如何促进应用的敏捷性、可扩展性和高可用性,进而推动企业数字化转型进程。不同于传统摘要仅概述内容要点,本部分将融入具体案例分析,直观展示云原生技术在实际应用中的显著成效与挑战应对策略,为读者提供更加丰富、立体的理解视角。 ####
|
16天前
|
UED
<大厂实战经验> Flutter&鸿蒙next 中使用 initState 和 mounted 处理异步请求的详细解析
在 Flutter 开发中,处理异步请求是常见需求。本文详细介绍了如何在 `initState` 中触发异步请求,并使用 `mounted` 属性确保在适当时机更新 UI。通过示例代码,展示了如何安全地进行异步操作和处理异常,避免在组件卸载后更新 UI 的问题。希望本文能帮助你更好地理解和应用 Flutter 中的异步处理。
61 3
|
16天前
|
JavaScript API 开发工具
<大厂实战场景> ~ Flutter&鸿蒙next 解析后端返回的 HTML 数据详解
本文介绍了如何在 Flutter 中解析后端返回的 HTML 数据。首先解释了 HTML 解析的概念,然后详细介绍了使用 `http` 和 `html` 库的步骤,包括添加依赖、获取 HTML 数据、解析 HTML 内容和在 Flutter UI 中显示解析结果。通过具体的代码示例,展示了如何从 URL 获取 HTML 并提取特定信息,如链接列表。希望本文能帮助你在 Flutter 应用中更好地处理 HTML 数据。
99 1
|
9天前
|
前端开发 中间件 PHP
PHP框架深度解析:Laravel的魔力与实战应用####
【10月更文挑战第31天】 本文作为一篇技术深度好文,旨在揭开PHP领域璀璨明星——Laravel框架的神秘面纱。不同于常规摘要的概括性介绍,本文将直接以一段引人入胜的技术剖析开场,随后通过具体代码示例和实战案例,逐步引导读者领略Laravel在简化开发流程、提升代码质量及促进团队协作方面的卓越能力。无论你是PHP初学者渴望深入了解现代开发范式,还是经验丰富的开发者寻求优化项目架构的灵感,本文都将为你提供宝贵的见解与实践指导。 ####
|
13天前
|
前端开发 JavaScript
JavaScript新纪元:ES6+特性深度解析与实战应用
【10月更文挑战第29天】本文深入解析ES6+的核心特性,包括箭头函数、模板字符串、解构赋值、Promise、模块化和类等,结合实战应用,展示如何利用这些新特性编写更加高效和优雅的代码。
31 0