【数据库评测】[续]Cloudwave 4.0 集群版(4节点) VS Starrocks 3.0 集群版(4节点)

简介: 【数据库评测】[续]Cloudwave 4.0 集群版(4节点) VS Starrocks 3.0 集群版(4节点)

一、写在前头




在写上一篇【数据库评测】Cloudwave 4.0 集群版(4节点) VS Starrocks 3.0 集群版(4节点)

,评测的过程中,意外发现starrocks3.0版本在我预先设置hdfs副本数=2的配置下,自行把starrocks自己的hdfs副本数改成3。为了保持环境的一致性,七镜还是决定测一测Cloudwave4.0在hdfs副本数=3的配置下,是什么表现。




二、评测环境


  • 硬件环境:4台 64核256g 云服务器(组成4节点的集群),essd pl1 高效云盘
  • 软件环境:jdk19(Cloudwave4.0官方推荐版本,官方基于jdk19版本里头的的vector api,实现全面向量化引擎)、jdk8(starrocks安装推荐jdk版本,主要用于fe,亦可少踩坑)、mysql8(作为starrocks的客户端)、hadoop 3.2.2(作为cloudwave 和 starrocks 共同的分布式存储,副本数=3
  • 软件版本:Cloudwave 4.0(最新版在2023年5月份发版),Starrocks 3.0(最新版在2023年4月份发版)
  • 评测数据集:ssb1000
表名 行数 说明
lineorder 60 亿 SSB 商品订单表
customer 3000 万 SSB 客户表
part 200 万 SSB 零部件表
supplier 200 万 SSB 供应商表
dates 2556 日期表





三、评测方法


  • 执行19轮测试脚本,每轮执行13条标准测试sql,去除第1轮的测试数据(由于IO原因,第1次查询两边的性能均受IO影响,本测试主要测数据库引擎的算法在同等计算资源的条件下的优劣,因此去除第一轮测试数据),将余下的18轮测试数据做平均,获得每条sql的平均耗时;
  • 观察最大CPU占用
  • 观察存储压缩比
  • 观察数据加载时间



多表联合join测试


  • 测试方法:执行19轮SQL测试脚本,每轮执行1条多表联合join拓展测试sql,去除第1轮的测试数据(由于IO原因,第1次查询两边的性能均受IO影响,本测试主要测数据库引擎的算法在同等计算资源的条件下的优劣,因此去除第一轮测试数据),将余下的18轮测试数据做平均,获得sql的平均耗时
  • 观察最大CPU占用
  • 统计耗时
  • 多表联合join拓展测试SQL1:select count(*) from lineorder,customer where lo_custkey = c_custkey;
  • 多表联合join拓展测试SQL2:select count(*) from lineorder,customer,supplier where lo_custkey = c_custkey and lo_suppkey = s_suppkey;




四、开始测试cloudwave4.0


1. 配置hdfs的副本数=3

26608654-1b7d35860447a048.png


2. 加载ssb1000数据

  • 使用的也是57分37秒



3. 查看压缩比

  • ssb1000原始数据的文件系统占用为606G,导入到Cloudwave4.0之后,是360G,压缩比还是59%(360g/606g)



4. 测试13条标准测试SQL

  • 从上图可以看到CPU最大占用是89.5%(5731%/6400%)


26608654-b95af2ee1e9ac3b4.png

  • 从上图可以看到13条标准SQL的总耗时,19轮查询去掉第一轮查询的平均耗时是:7.42秒




四、评测结论


结合Starrocks3.0的测试数据,汇总出下表

26608654-f2bd43dc83ac4b28.png


Cloudwave4.0集群版在4台64核256g内存的云服务器上,hdfs副本数=3的环境下,测ssb1000国际标准测试集,优于Starrocks3.0集群版近0.4倍


[附]13条标准测试SQL测试结果表:

数据库 数据集 响应时间(s) CPU 最大占用率 存储压缩比 数据导入时间
Cloudwave4.0 ssb1000 7.416 89.5%(5731%/6400%) 59%(360g/606g) 57分37秒
Starrocks3.0 ssb1000 10.397 66.6%(4266%/6400%) 169%(1024g/606g) 112分钟

翰云云原生数据仓库(Cloudwave4.0)未来可期,七镜后续还将带来翰云云原生数仓在S3对象存储上的性能表现、更大的数据集上的表现、不同的数据集上的表现、以及在云的加持下,Cloudwave4.0的云原生架构是如何发挥其自身优势的,敬请期待。

目录
相关文章
|
2月前
|
关系型数据库 分布式数据库 数据库
PolarDB常见问题之数据库不能自己减少节点如何解决
PolarDB是阿里云推出的下一代关系型数据库,具有高性能、高可用性和弹性伸缩能力,适用于大规模数据处理场景。本汇总囊括了PolarDB使用中用户可能遭遇的一系列常见问题及解答,旨在为数据库管理员和开发者提供全面的问题指导,确保数据库平稳运行和优化使用体验。
|
6月前
|
监控 NoSQL Redis
Redis数据库操作---包括搭建集群(下)
Redis数据库操作---包括搭建集群(下)
49 0
|
2月前
|
架构师 NoSQL 大数据
直播预告|小白开箱: 云数据库在五朵云上的评测
3 月 7 日,周四晚上 19:00-20:30 由明说三人行组织,邀请了 NineData 国际总经理(GM) Ni Demai、云猿生数据 CTO & 联合创始人子嘉,和《明说三人行》创始人 &主持人明叔,共同围绕《小白开箱: 云数据库在五朵云上的评测》的主题展开技术对话。探究在百家争鸣的多云时代下,到底孰强孰弱?多云时代云数据库选型过程中面临的挑战。
24 1
|
7月前
|
数据库
云效构建需要链接数据库 数据库有ip白名单 在哪里看构建集群的ip?
云效构建需要链接数据库 数据库有ip白名单 在哪里看构建集群的ip?
55 1
|
3月前
|
SQL 物联网 数据挖掘
StarRocks:从概念到应用的下一代分析型数据库
在大数据时代,企业对数据处理的需求日益增长,特别是在实时数据分析方面。StarRocks 是一种新兴的分布式关系型数据库,专为快速且高并发的实时分析设计。本文将从 StarRocks 的基本概念入手,逐步深入到其应用层面,探讨这一技术如何在现实世界中发挥作用。
99 1
|
3月前
|
存储 安全 测试技术
数据库怎么评测
数据库怎么评测
32 8
|
4月前
|
存储 数据库
云数据库ClickHouse企业版集群费用 | 企业版费用
云数据库ClickHouse企业版集群费用由计算资源费用和存储资源费用两部分组成。本文介绍不同计费项的费用。
39 0
|
4月前
|
数据库 OceanBase
OceanBase数据库是一个分布式集群产品,在部署时对硬件资源有特定的需求
OceanBase数据库是一个分布式集群产品,在部署时对硬件资源有特定的需求【1月更文挑战第12天】【1月更文挑战第56篇】
29 2
|
5月前
|
存储 Oracle 关系型数据库
“多写多读集群”被攻克,中国数据库产业“越过山丘”
在自主创新的道路上默默苦行了十几年的中国数据库产业,正在越过山丘,等待他们的,将是一个繁荣的数据库生态。
|
5月前
|
JSON 自然语言处理 负载均衡
数据库-Elasticsearch进阶学习笔记(集群、故障、扩容、简繁体、拼音等)
数据库-Elasticsearch进阶学习笔记(集群、故障、扩容、简繁体、拼音等)
57 0