Kudu入门_对比_列式和行式|学习笔记

简介: 快速学习Kudu入门_对比_列式和行式

开发者学堂课程【2020版大数据实战项目之DMP广告系统(第一阶段)Kudu入门_对比_列式和行式】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/676/detail/11752


Kudu入门_对比_列式和行式


列式存储和行式存储

行式和列式存储是不同的存储方式。其大致如下

image.png

1、行式存储

行式适合于比较精确的查询比较方便。行式存储会认为列式存储是不划算的,就可能一次只取出一小部分。那些没有取出来的就是对性能的提升。行式一般用作于 OLTP,例如我的订单,那不仅要看到订单,还要看到收货地址,付款信息,派送信息等,所以 OLTP 一般是倾向于获取整行所有列的信息。

2、列式存储

列式存储比较适合用于 OLAP 型,因为 OLAP 比较强调于查询和扫描性。如果是列式存储用不到中间那一列,可以不加载那一列,直接加载第一列或者第三列,那总体上数据量会少于三分之一,明显是非常大的性能提升。列式存储就有非常重要的假设,一次把一列的数据整出来,那么假设你要使用到这一列的大部分数据,如果按列存,就可以按列进行取舍,按行取舍不了那么多。例如当分析销售额的时候,那可能只对销售额这一列感兴趣,所以按照列存储,只需获取需要的列,这样能减少数据的读取量。

相关文章
|
存储 缓存 分布式计算
大数据开发笔记(十):Hbase列存储数据库总结
HBase 本质上是一个数据模型,可以提供快速随机访问海量结构化数据。利用 Hadoop 的文件系统(HDFS)提供的容错能 力。它是 Hadoop 的生态系统,使用 HBase 在 HDFS 读取消费/随机访问数据,是 Hadoop 文件系统的一部分。
899 0
大数据开发笔记(十):Hbase列存储数据库总结
|
5月前
|
SQL 分布式数据库 HIVE
分布式NoSQL列存储数据库Hbase(六)
分布式NoSQL列存储数据库Hbase(六)
50 0
|
5月前
|
存储 NoSQL 分布式数据库
分布式NoSQL列存储数据库Hbase(一)Hbase的功能与应用场景、基本设计思想
分布式NoSQL列存储数据库Hbase(一)Hbase的功能与应用场景、基本设计思想
164 0
|
5月前
|
NoSQL 分布式数据库 数据库
分布式NoSQL列存储数据库Hbase_列族的设计(五)
分布式NoSQL列存储数据库Hbase_列族的设计(五)
202 0
|
5月前
|
存储 NoSQL 分布式数据库
分布式NoSQL列存储数据库Hbase_高级思想(八)
分布式NoSQL列存储数据库Hbase_高级思想(八)
41 0
|
5月前
|
SQL 存储 NoSQL
分布式NoSQL列存储数据库Hbase操作(二)
分布式NoSQL列存储数据库Hbase操作(二)
115 0
|
存储 消息中间件 NoSQL
聊一聊数据库的行存与列存
好多人最开始学习数据库的时候,是关系数据库,数据以表格形式存储,一行表示一条记录。其实这种就是典型的行存储(Row-based store),将表按行存储到磁盘分区上。 而一些数据库还支持列存储(Column-based store),它将表按列存储到磁盘分区上。
聊一聊数据库的行存与列存
|
10月前
|
存储 算法 数据挖掘
行式存储和列式存储的区别
行式存储和列式存储的区别
337 0
|
存储 数据挖掘 分布式数据库
kudu入门 _应用场景_kudu|学习笔记
快速学习kudu入门 _应用场景_kudu
88 0
kudu入门 _应用场景_kudu|学习笔记