开发者学堂课程【大数据 Hive 教程精讲:Apache Hive--介绍&Hive 实现思路模拟】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/90/detail/1360
Apache Hive--介绍&Hive实现思路模拟
内容介绍:
一、Hive简介
二、为什么使用Hive?
一、Hive简介:
什么是 Hive?
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类 SQL查询功能。
本质是将 SQL 转换为 MapReduce 程序。
主要用途:用来做离线数据分析,比直接用 MapReduce开发效率更高。
为什么使用Hive?
直接使用 Hadoop MapReduce 处理数据所面临的问题:
人员学习成本太高
MapReduce 实现复杂查询逻辑开发难度太大使用 Hive :
操作接口采用类 SQL 语法,提供快速开发的能力
避免了去写 MapReduce,减少开发人员的学习成本
功能扩展很方便