Hive 的数据表分为两种,内部表和外部表。
内部表:这种表可以理解为数据和表结构都保存在一起的数据表。
外部表:在表结构创建以前,数据已经保存在 HDFS 中,通过创建表结构,将数据格式化到表的结果里。
进一步分析,
内部表而言,当通过 DROP TABLE table_name 删除元数据中表结构的同时,表中的数据也同样会从 HDFS 中被删除。
外部表而言,当进行 DROP TABLE table_name 操作的时候,Hive 仅仅删除元数据的表结构,而不删除 HDFS 上的文件(即表里的数据),所以,相比内部表,外部表可以更放心大胆地使用。
数据表在删除的时候,内部表会连数据一起删除,而外部表只删除表结构,数据还是保留的。
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/5660245.html,如需转载请自行联系原作者