表(数据+元数据)。 存的是和hdfs的映射关系,hive是逻辑上的数据仓库,实际操作的都是hdfs上的文件,HQL就是用sql语法来写的mr程序。
Hive是基于 Hadoop 的一个数据仓库工具: hive本身不提供数据存储功能,使用HDFS做数据存储; hive也不分布式计算框架,hive的核心工作就是把sql语句翻译成MR程序; hive也不提供资源调度系统,也是默认由Hadoop当中YARN集群来调度; 可以将结构化的数据映射为一张数据库表,并提供 HQL(Hive SQL)查询功能。 Hive的体系架构大致分为: 1. 用户接口 提供脚手架 2. 核心功能, 元数据存储,包含mysql等定义等等 3. 核心组件, 包括执行器,解释器等等一系列工具 4. 数据存储 提供存储在HDFS中的数据的数据模型。供使用
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。