文档备案控制台

开发者社区大数据文章正文

Hadoop Hive概念学习系列之内部表和外部表对比分析（二）

2017-11-20 1447

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Hive 的数据表分为两种，内部表和外部表。

　　 内部表：这种表可以理解为数据和表结构都保存在一起的数据表。

　　外部表：在表结构创建以前，数据已经保存在 HDFS 中，通过创建表结构，将数据格式化到表的结果里。

进一步分析，
内部表而言，当通过 DROP TABLE table_name 删除元数据中表结构的同时，表中的数据也同样会从 HDFS 中被删除。

外部表而言，当进行 DROP TABLE table_name 操作的时候，Hive 仅仅删除元数据的表结构，而不删除 HDFS 上的文件（即表里的数据），所以，相比内部表，外部表可以更放心大胆地使用。

数据表在删除的时候，内部表会连数据一起删除，而外部表只删除表结构，数据还是保留的。

本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/5660245.html，如需转载请自行联系原作者

文章标签：

SQL

HIVE

分布式计算

Hadoop

关键词：

Hive外部表

hadoop hive

hadoop分析

hadoop概念

hadoop hive分析

技术小哥哥

目录

相关文章

喜欢猪猪

|

存储分布式计算 Hadoop

Hadoop Distributed File System (HDFS): 概念、功能点及实战

【6月更文挑战第12天】Hadoop Distributed File System (HDFS) 是 Hadoop 生态系统中的核心组件之一。它设计用于在大规模集群环境中存储和管理海量数据，提供高吞吐量的数据访问和容错能力。

喜欢猪猪

1545 4 4

赵渝强老师

|

SQL 存储关系型数据库

【赵渝强老师】Hive的内部表与外部表

Hive是基于HDFS的数据仓库，支持SQL查询。其数据模型包括内部表、外部表、分区表、临时表和桶表。本文介绍了如何创建和使用内部表和外部表，提供了详细的步骤和示例代码，并附有视频讲解。

赵渝强老师

1157 1 1

武子康

|

SQL 分布式计算 Hadoop

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（一）

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（一）

武子康

399 4 4

武子康

|

SQL 分布式计算 Hadoop

Hadoop-12-Hive 基本介绍下载安装配置 MariaDB安装 3台云服务Hadoop集群架构图对比SQL HQL

Hadoop-12-Hive 基本介绍下载安装配置 MariaDB安装 3台云服务Hadoop集群架构图对比SQL HQL

武子康

446 3 3

武子康

|

SQL 分布式计算 Hadoop

Hadoop-19 Flume Agent批量采集数据到HDFS集群监听Hive的日志操作则把记录写入到HDFS 方便后续分析

Hadoop-19 Flume Agent批量采集数据到HDFS集群监听Hive的日志操作则把记录写入到HDFS 方便后续分析

武子康

398 2 2

武子康

|

SQL

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（二）

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（二）

武子康

588 2 2

武子康

|

分布式计算 Hadoop Unix

Hadoop-28 ZooKeeper集群 ZNode简介概念和测试数据结构与监听机制持久性节点持久顺序节点事务ID Watcher机制

Hadoop-28 ZooKeeper集群 ZNode简介概念和测试数据结构与监听机制持久性节点持久顺序节点事务ID Watcher机制

武子康

407 1 1

1941623231718325

|

存储 SQL 分布式计算

Hadoop生态系统概述：构建大数据处理与分析的基石

【8月更文挑战第25天】Hadoop生态系统为大数据处理和分析提供了强大的基础设施和工具集。通过不断扩展和优化其组件和功能，Hadoop将继续在大数据时代发挥重要作用。

1941623231718325

1074 3 3

wljslmz

|

存储分布式计算 Hadoop

Hadoop 2.0 中 Active NameNode 和 Standby NameNode 是什么概念？

【8月更文挑战第12天】

wljslmz

667 4 4

热门文章

最新文章

hive中将单行拆分成多行总结

【通过Hive清洗、处理和计算原始数据，Hive清洗处理后的结果，将存入Hbase，海量数据随机查询场景从HBase查询数据】

Hive 行列转换

大数据Hive多字节分隔符

Hive实战(03)-深入了解Hive JDBC：在大数据世界中实现数据交互

DataGrip连接Hive执行DDL操作报错：「FAILED: ParseException line 1:5 cannot recognize input near 'show' 'indexes' 'on' in ddl statement」

大数据新视界 --大数据大厂之Hive与大数据融合：构建强大数据仓库实战指南

hive分区与分桶

java链接hive数据库实现增删改查操作

Hive 分析函数lead、lag实例应用

Ubuntu22.04下搭建Hadoop3.3.6+Hbase2.5.6+Phoenix5.1.3开发环境的指南

CentOS中构建高可用Hadoop 3集群

“Hadoop整不明白，数据分析就白搭？”——教你用Hadoop撸清大数据处理那点事

Hadoop生态系统：从小白到老司机的入门指南

从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路

Dataphin功能Tips系列（41）-Hadoop集群管理

【赵渝强老师】史上最详细：Hadoop HDFS的体系架构

从Excel到Hadoop：数据规模的进化之路

MPP 架构与 Hadoop 架构技术选型指南

基于Java的Hadoop文件处理系统：高效分布式数据解析与存储

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop企业优化及扩展案例

大数据Hive教程精讲

相关电子书

更多

spark替代HIVE实现ETL作业

2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践

自建Hadoop数据如何托管到MaxCompute

相关实验场景

更多

搭建Hadoop环境

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！