Kudu入门_对比_列式和行式|学习笔记

简介: 快速学习Kudu入门_对比_列式和行式

开发者学堂课程【2020版大数据实战项目之DMP广告系统(第一阶段)Kudu入门_对比_列式和行式】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/676/detail/11752


Kudu入门_对比_列式和行式


列式存储和行式存储

行式和列式存储是不同的存储方式。其大致如下

image.png

1、行式存储

行式适合于比较精确的查询比较方便。行式存储会认为列式存储是不划算的,就可能一次只取出一小部分。那些没有取出来的就是对性能的提升。行式一般用作于 OLTP,例如我的订单,那不仅要看到订单,还要看到收货地址,付款信息,派送信息等,所以 OLTP 一般是倾向于获取整行所有列的信息。

2、列式存储

列式存储比较适合用于 OLAP 型,因为 OLAP 比较强调于查询和扫描性。如果是列式存储用不到中间那一列,可以不加载那一列,直接加载第一列或者第三列,那总体上数据量会少于三分之一,明显是非常大的性能提升。列式存储就有非常重要的假设,一次把一列的数据整出来,那么假设你要使用到这一列的大部分数据,如果按列存,就可以按列进行取舍,按行取舍不了那么多。例如当分析销售额的时候,那可能只对销售额这一列感兴趣,所以按照列存储,只需获取需要的列,这样能减少数据的读取量。

相关文章
|
存储 数据库 索引
61.【clickhouse】ClickHouse从入门到放弃-MergeTree的存储结构
【clickhouse】ClickHouse从入门到放弃-MergeTree的存储结构
61.【clickhouse】ClickHouse从入门到放弃-MergeTree的存储结构
|
存储 缓存 分布式计算
大数据开发笔记(十):Hbase列存储数据库总结
HBase 本质上是一个数据模型,可以提供快速随机访问海量结构化数据。利用 Hadoop 的文件系统(HDFS)提供的容错能 力。它是 Hadoop 的生态系统,使用 HBase 在 HDFS 读取消费/随机访问数据,是 Hadoop 文件系统的一部分。
1172 0
大数据开发笔记(十):Hbase列存储数据库总结
|
存储 SQL 分布式计算
一文彻底搞懂Hive的数据存储与压缩
怎样弄清Hive的数据存储与压缩呢,以下回答告诉你。
772 0
一文彻底搞懂Hive的数据存储与压缩
|
存储 NoSQL 关系型数据库
什么是列式存储,一文秒懂
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 从数据存储讲起 我们最先接触的数据库系统,大部分都是行存储系统。大学的时候学数据库,老师让我们将数据库想象成一张表格,每条数据记录就是一行数据,每行数据包含若干列。
什么是列式存储,一文秒懂
|
8月前
|
SQL 存储 测试技术
提升50%+!Presto如何提升Hudi表查询性能?
提升50%+!Presto如何提升Hudi表查询性能?
187 0
|
8月前
|
NoSQL 分布式数据库 数据库
分布式NoSQL列存储数据库Hbase_列族的设计(五)
分布式NoSQL列存储数据库Hbase_列族的设计(五)
272 0
|
存储 算法 数据挖掘
行式存储和列式存储的区别
行式存储和列式存储的区别
1102 0
|
数据挖掘 大数据 OLAP
Kudu入门_对比 _OLAP和OLTP|学习笔记
快速学习Kudu入门_对比 _OLAP和OLTP
194 0
Kudu入门_对比 _OLAP和OLTP|学习笔记
|
存储 缓存 NoSQL
了解 kudu 数据模型 | 学习笔记
快速学习 了解 kudu 数据模型
256 0
了解 kudu 数据模型 | 学习笔记
|
存储 SQL 数据挖掘
kudu原理_ Kudu是什么|学习笔记
快速学习kudu原理_ Kudu是什么
104 0