Hive VS MySQL
描述 | Hive | MySQL |
数据存储位置 | HDFS | 本地磁盘 |
数据格式 | 用户定义 | 系统决定 |
数据更新 | 不支持(高版本ORC支持) | 支持 |
索引 | 有,但较弱 | 有,经常使用的 |
执行 | MapReduce | Executor |
执行延迟 | 高 | 低 |
可扩展性 | 高 | 低 |
数据规模 | 大 | 小 |
数据库 VS 数据仓库
- 数据库:传统的关系型数据库主要应用在基本的事务处理,例如银行交易之类的场景。数据库支持增删改查这些常见的操作。
- 数据仓库:主要做一些复杂的分析操作,侧重决策支持,相对数据库而言,数据仓库分析的数据规模要大 得多。但是数据仓库只支持查询操作,不支持修改和删除
- 数据库与数据仓库的本质区别就是 OLTP与OLAP 的区别
OLTP VS OLAP
- OLTP(On-Line Transaction Processing):操作型处理,称为联机事务处理,也可以称为面向交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。用户较为 关心操作的响应时间、数据的安全性、完整性等问题
- OLAP(On-Line Analytical Processing):分析型处理,称为联机分析处理,一般针对某些主题历史数 据进行分析,支持管理决策。
其实从字面上来对比,OLTP 和 OLAP 只有一个单词不一样 OLTP侧重于事务,OLAP侧重于分析 所以数据库和数据仓库的特性是不一样的,不过我们平时在使用的时候,可以把Hive作为一个数据库来操作,但是你要知道他们两个是不一样的。数据仓库的概念是比数据库要大的多。