20180607早课记录26-Hive

简介: 今天来讲Hive

1.hive哪些sql会触发mr job


带聚合函数,某些insert,还有create table as select


2.create table t as select ...这样的SQL会不会创建mrjob



3.hive的数据分为哪两块 分别存储哪里


元数据和真实数据,分别存储在mysql,hdfs中


4.一般工作中,udf编写是很多的,那么怎样临时生效,永久生效?


临时生效就是add jar,然后create temporary function

永久生效要registerUDF


5.那么在工作中,一般分区表用的很多,那么一般我们会选择哪些特征值作为分区字段?


时间


6.生产上 分区表 又分为静态分区表和动态分区表,那么区别是什么?怎样实现?


静态根据指定字段和给定值分区,动态分区值在字段里


7.vi命令 从window复盖一个文件内容到Linux的文件,哪些步骤?


命令行模式下输入gg + dG清空文件 注意要在编辑模式复制,如果在命令模式复制,会丢失前几行


8.谈谈对jps理解


jps java进程


9.谈谈对pid文件理解


存储进程id的文件,用来杀进程的时候使用


10.输入一个命令,找不到,not  found,请问你们觉得应该怎么办


首先看看命令有没有打错 然后检查环境变量或者find下 实在没有在进行安装

目录
相关文章
|
SQL HIVE
49 Hive修改表
49 Hive修改表
34 0
49 Hive修改表
|
SQL 存储 分布式计算
Hive的简单操作
Hive的简单操作
65 0
|
3月前
|
SQL 分布式计算 数据处理
实时计算 Flink版产品使用问题之怎么将数据从Hive表中读取并写入到另一个Hive表中
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
3月前
|
SQL 存储 监控
Hive 插入大量数据
【8月更文挑战第15天】
|
6月前
|
SQL 存储 分布式数据库
【Hive】Hive有索引吗?
【4月更文挑战第14天】【Hive】Hive有索引吗?
|
6月前
|
SQL 存储 分布式计算
【Hive】hive内部表和外部表的区别
【4月更文挑战第14天】【Hive】hive内部表和外部表的区别
|
6月前
|
SQL 分布式计算 Java
Hive【Hive(三)查询语句】
Hive【Hive(三)查询语句】
|
SQL 存储 分布式数据库
hive中的索引
hive中的索引
318 0
|
SQL 数据库 HIVE
hive进行表的操作
hive进行表的操作
hive进行表的操作
|
SQL 存储 分布式计算
SparkSQL 读写_Hive_创建 Hive 表 | 学习笔记
快速学习 SparkSQL 读写_Hive_创建 Hive 表
761 0
SparkSQL 读写_Hive_创建 Hive 表 | 学习笔记
下一篇
无影云桌面