性能30%↑|阿里云AnalyticDB X AMD EPYC,数据分析步入Next Level

简介: 阿里云原生数仓 AnalyticDB for PostgreSQL 与 AMD 新一代硬件深度优化,结合全自研计算引擎及行列混合存储实现性能升级,综合性能提升30%。结合丰富的企业级能力帮助企业构建离在线一体、流批一体综合数据分析平台,采用同一引擎即可满足离线批处理、流式加工,交互式分析三种场景,在开发运维、时效性及成本上具备更高的性价比。

1、概述

阿里云原生数仓 AnalyticDB for PostgreSQL 与 AMD 新一代硬件深度优化,结合全自研计算引擎及行列混合存储实现性能升级,综合性能提升30%。结合丰富的企业级能力帮助企业构建离在线一体、流批一体综合数据分析平台,采用同一引擎即可满足离线批处理、流式加工,交互式分析三种场景,在开发运维、时效性及成本上具备更高的性价比。

2、性能优化路径

2.1 硬件架构优化

2.1.1 芯片性能提升

AMD 和阿里云联合打造的新一代硬件采用全新 CIPU 架构,处理器采用 AMD EPYC Genoa 处理器,可提供稳定的算力输出、更强劲的I/O引擎以及芯片级安全加固。

第四代 EPYC 较第三代 EPYC 性能提升显著针对分析型数据库产品痛点在高算力、高内存带宽、低延迟等特点进行优化,可帮助企业用户在数据仓库、在线分析场景中具备更好的性能。

2.1.2 计算能效提升

在性能功耗比方面,新一代服务器在相同核心数量下(对比搭载两个64核AMD EPYC 9534和两个64核的AMD EPYC 7763的服务器)整数性能提升约24%,浮点性提升约52%。可以用更少的服务器来完成同样的工作,或者用同样数量的服务器在相同的时间内完成更多的工作。

2.1.3 安全性和隔离性提升

第四代 AMD EPYC 支持安全内存加密(SME)和安全加密虚拟化(SEV),将内存与拥有他的线程相关联,从而帮助击退旁路攻击;增加了SEV中加密上下文的数量,可以容纳更多的安全虚拟机。

通过 AMD 安全加密状态(SEV-ES)帮助保护虚拟机状态不受恶意或受损管理程序影响;还增加AMD安全嵌套分页(SEV-SNP)功能,以防止数据重放、内存重映射等攻击。

2.2 数据库内核优化

2.2.1 全自研计算引擎

AnalyticDB for PostgreSQL 全自研计算引擎为数据处理和交互式分析加速。它通过以下技术实现性能提速

  • 应用芯片向量化技术如 SIMD 指令集等把芯片的并行化计算能力利用到极致。
  • 采用 LLVM JIT 即动态编译优化,加速计算以提高数据处理效率。
  • 自适应内存模型,根据计算模式动态选择行存/列存内存模型。
  • 针对典型场景提供加速方案,比如针对 Runtime Filter 加速Join分析,字典特性加速低基数字段计算场景等。

2.2.2 全自研行列混存

一份存储下即可支持实时高吞吐写入/更新和实时高聚合分析两种场景。

写入方面利用 Write Optimized Part 高效承接批量/流式数据并通过内部 Optimize 优化,将数据转化为更利于查询的 Read Optimized Part,从而实现高效的查询性能。利用 Metadata 实现高并发 Update/Delete。

支持基于 Btree 索引的强主键模型,在写入数据时实现高效精准去重。在实时写入场景中单 CPU Core 可达到10万行/秒的写入性能。

支持 Upsert 功能在产生主键冲突时用户可根据实际业务需要灵活地选择忽略更新、覆盖更新或是条件更新模式。

在查询方面存储引擎无缝兼容多种索引类型如 Btree , GIN , GIST 和 自研向量检索索引,可以实现任意维度的高性能点查,全文检索和向量检索。

2.2.3 资源隔离增强

支持混合负载实现资源最大化利用,可同时承载流式写入,数据加工,交互式分析三类任务。

引擎通过资源组实现资源管理,相对使用资源队列更精细化、管理资源类别更全面。

它支持对CPU、内存按照业务优先级设置资源隔离策略,支持动态配置,配置即生效不需要重启引擎,大大减轻运维压力。

2.2.4 安全能力增强

完善和增强安全能力:

  • 网络连接安全,支持 SSL TLS 1.1/1.2/1.3 加密算法,满足最新的网络安全要求。
  • 存储安全,支持云盘加密实现数据加密存储。
  • 加密算法,支持非对称加密和对称加密算法如 SM4。
  • 支持行级和列级权限管控,做到最细权限粒度控制和最小化敏感数据访问。
  • 动态数据脱敏,引擎级支持对敏感字段设置脱敏规则,实现敏感信息过滤和保护。
  • 支持 SQL 审计可对 SQL 操作明细进行审核。支持事件审计可实现对异常行为追溯。

3、测试结果

性能测试采用国际标准 TPC-H 测试集进行,实验组搭载 AMD EPYC Genoa 服务器 ,对照组集群搭载同等规格下的其它主流硬件。

3.1 测试资源

参数

实验组

对照组

Master节点

8CU

8CU

Master节点主机规格

搭载 AMD EPYC Genoa 服务器

线上主流服务器

计算节点

4个计算节点,单节点规格2C-16GB

4个计算节点,单节点规格2C-16GB

计算节点主机规格

搭载 AMD EPYC Genoa服务器

线上主流服务器

存储类型

ESSD云盘

ESSD云盘

3.2 测试过程

TPC-H Query

实验组较比对照组性能提升

TPC-H Q1

32.71%

TPC-H Q2

44.37%

TPC-H Q3

29.55%

TPC-H Q4

31.98%

TPC-H Q5

69.59%

TPC-H Q6

37.27%

TPC-H Q7

35.24%

TPC-H Q8

35.66%

TPC-H Q9

35.24%

TPC-H Q10

36.85%

TPC-H Q11

14.86%

TPC-H Q12

45.66%

TPC-H Q13

25.87%

TPC-H Q14

49.04%

TPC-H Q15

13.33%

TPC-H Q16

3.43%

TPC-H Q17

26.64%

TPC-H Q18

11.5%

TPC-H Q19

34.9%

TPC-H Q20

25.85%

TPC-H Q21

25.33%

TPC-H Q22

14.99%

平均性能提升

32.71%

3.3 测试总结

采用国际标准 TPC-H 测试集以及在同等运行环境下,AnalyticDB for PostgreSQL 采用 AMD EPY 服务器较比常规主流服务器平均性能提升 32.7%。

4、优势及应用场景

4.1 离在线一体分析

AnalyticDB for PostgreSQL 在 AMD 硬件加持和全自研计算引擎及存储助力下,可同时提供稳定高效的离线批处理和高性能在线报表分析能力,具备高性价比:

  • 数据加工后即可为下游报表工具或系统提供在线数据分析服务,避免在多引擎中同步数据造成数据不一致和时效性低的问题。
  • 全自研引擎实现高性能交互式分析,行列混合存储可实现高效的IO裁剪,加速多维组合分析。
  • 支持实时物化视图实现高并发报表查询。

4.2 海外数仓平滑迁移

SQL语法全覆盖并且支持自定义函数和存储过程。高度兼容 Greenplum/Redshift/Synapse/Snowflake 语法。

可覆盖海外云数仓产品企业级能力,在安全能力、资源隔离、容灾等方面实现加强。在实时分析、交互式分析能力上较比海外数仓功能及性能更好,更具性价比。

4.3 流批一体实时数仓

自研业界领先流批一体引擎让用户在数仓内即可开发流式任务,支持对批和流任务进行细粒度的资源隔离。

  • 可消费 Kafka/Flink/DTS 实时数据源,支持高吞吐流式数据写入。
  • 支持增量实时物化视图同步和异步刷新,可实现实时多表关联(支持左连接和右连接)、全量历史数据回溯、流和批表关联。
  • 可支持实时 Ad-hoc 查询,满足实时报表分析和下游应用系统高时效性数据需求。

5、开启方式

新购实例默认开启 AMD 形态,无需控制台选择。

相关实践学习
数据库实验室挑战任务-初级任务
本场景介绍如何开通属于你的免费云数据库,在RDS-MySQL中完成对学生成绩的详情查询,执行指定类型SQL。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
11天前
|
分布式计算 关系型数据库 数据挖掘
实时数仓 Hologres产品使用合集之当使用动态分区管理功能按日期进行分区后,通过主键和segment_key进行时间范围查询性能变差是什么原因
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
23天前
|
存储 安全 数据挖掘
性能30%↑|阿里云AnalyticDB*AMD EPYC,数据分析步入Next Level
第4代 AMD EPYC加持,云原生数仓AnalyticDB分析轻松提速。
性能30%↑|阿里云AnalyticDB*AMD EPYC,数据分析步入Next Level
|
21天前
|
SQL 测试技术 OLAP
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
现代化实时数仓 SelectDB 在时隔两年后再次完成登顶,在全部近百款数据库和数十种机型中,性能位居总榜第一!
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
|
15天前
|
存储 缓存 测试技术
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
近日,在 ClickHouse 发起的分析型数据库性能测试排行榜 ClickBench(https://benchmark.clickhouse.com/)中,现代化实时数仓 SelectDB 时隔两年后再次登顶,在全部近百款数据库和数十种机型中,性能表现位居总榜第一!
53 1
|
11天前
|
分布式计算 算法 关系型数据库
实时数仓 Hologres产品使用合集之如何优化查询性能
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
23天前
|
存储 固态存储 安全
阿里云4核CPU云服务器价格参考,最新收费标准和活动价格
阿里云4核CPU云服务器多少钱?阿里云服务器核数是指虚拟出来的CPU处理器的核心数量,准确来讲应该是vCPU。CPU核心数的大小代表了云服务器的运算能力,CPU越高,云服务器的性能越好。阿里云服务器1核CPU就是一个超线程,2核CPU2个超线程,4核CPU4个超线程,这样云服务器可以同时处理多个任务,计算性能更强。如果网站流程较小,少量图片展示的企业网站,建议选择2核及以上CPU;如果网站流量较大,动态页面比较多,有视频等,建议选择4核、8核以上CPU。
阿里云4核CPU云服务器价格参考,最新收费标准和活动价格
|
20天前
|
存储 固态存储 安全
租用阿里云企业级云服务器最新收费标准与活动价格参考
租用阿里云企业级云服务器多少钱?阿里云服务器有多种实例分类,其中通用型、计算型、内存型、通用算力型、大数据型、本地SSD、高主频型和增强型均属于企业级云服务器,目前在阿里云的活动中,通用型、计算型、内存型和通用算力型均有优惠,下面是阿里云企业级云服务器价格表,包含最新收费标准与活动价格,以表格形式展示给大家,以供参考和了解。
租用阿里云企业级云服务器最新收费标准与活动价格参考
|
4天前
|
弹性计算
2024年阿里云免费云服务器及学生三百通用额度申请教程参考
阿里云2024年继续提供免费学生云服务器,最长可享7个月(1+6个月);还有300元无门槛抵用金,适用于全量公共云产品(特殊商品除外)。学生需完成身份认证和任务以领取和续费。此外,有3个月免费的飞天试用云服务器,分为个人和企业版。详细申请教程包括学生认证、试用产品选择等步骤,可访问指定阿里云链接进行操作。
113 2
|
3天前
|
SQL 弹性计算 API
云服务器 ECS产品使用问题之如何通过API调用阿里云服务器上SQL Server数据库中的数据
云服务器ECS(Elastic Compute Service)是各大云服务商阿里云提供的一种基础云计算服务,它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。

热门文章

最新文章

相关产品

  • 云原生数据仓库AnalyticDB MySQL版