Kudu入门_对比_列式和行式|学习笔记

简介: 快速学习Kudu入门_对比_列式和行式

开发者学堂课程【2020版大数据实战项目之DMP广告系统(第一阶段)Kudu入门_对比_列式和行式】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/676/detail/11752


Kudu入门_对比_列式和行式


列式存储和行式存储

行式和列式存储是不同的存储方式。其大致如下

image.png

1、行式存储

行式适合于比较精确的查询比较方便。行式存储会认为列式存储是不划算的,就可能一次只取出一小部分。那些没有取出来的就是对性能的提升。行式一般用作于 OLTP,例如我的订单,那不仅要看到订单,还要看到收货地址,付款信息,派送信息等,所以 OLTP 一般是倾向于获取整行所有列的信息。

2、列式存储

列式存储比较适合用于 OLAP 型,因为 OLAP 比较强调于查询和扫描性。如果是列式存储用不到中间那一列,可以不加载那一列,直接加载第一列或者第三列,那总体上数据量会少于三分之一,明显是非常大的性能提升。列式存储就有非常重要的假设,一次把一列的数据整出来,那么假设你要使用到这一列的大部分数据,如果按列存,就可以按列进行取舍,按行取舍不了那么多。例如当分析销售额的时候,那可能只对销售额这一列感兴趣,所以按照列存储,只需获取需要的列,这样能减少数据的读取量。

相关文章
|
存储 数据库 索引
61.【clickhouse】ClickHouse从入门到放弃-MergeTree的存储结构
【clickhouse】ClickHouse从入门到放弃-MergeTree的存储结构
61.【clickhouse】ClickHouse从入门到放弃-MergeTree的存储结构
|
存储 缓存 分布式计算
大数据开发笔记(十):Hbase列存储数据库总结
HBase 本质上是一个数据模型,可以提供快速随机访问海量结构化数据。利用 Hadoop 的文件系统(HDFS)提供的容错能 力。它是 Hadoop 的生态系统,使用 HBase 在 HDFS 读取消费/随机访问数据,是 Hadoop 文件系统的一部分。
1056 0
大数据开发笔记(十):Hbase列存储数据库总结
|
4月前
|
存储 NoSQL Java
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
77 0
|
5月前
|
SQL 分布式数据库 HIVE
分布式NoSQL列存储数据库Hbase(六)
分布式NoSQL列存储数据库Hbase(六)
74 0
|
5月前
|
NoSQL 分布式数据库 数据库
分布式NoSQL列存储数据库Hbase_列族的设计(五)
分布式NoSQL列存储数据库Hbase_列族的设计(五)
240 0
|
5月前
|
存储 NoSQL 分布式数据库
分布式NoSQL列存储数据库Hbase(一)Hbase的功能与应用场景、基本设计思想
分布式NoSQL列存储数据库Hbase(一)Hbase的功能与应用场景、基本设计思想
315 0
|
5月前
|
存储 NoSQL 分布式数据库
分布式NoSQL列存储数据库Hbase_高级思想(八)
分布式NoSQL列存储数据库Hbase_高级思想(八)
58 0
|
5月前
|
SQL 存储 NoSQL
分布式NoSQL列存储数据库Hbase操作(二)
分布式NoSQL列存储数据库Hbase操作(二)
136 0
|
存储 数据挖掘 分布式数据库
kudu入门 _应用场景_kudu|学习笔记
快速学习kudu入门 _应用场景_kudu
109 0
kudu入门 _应用场景_kudu|学习笔记
|
存储 缓存 NoSQL
了解 kudu 数据模型 | 学习笔记
快速学习 了解 kudu 数据模型
234 0
了解 kudu 数据模型 | 学习笔记