文档备案控制台

开发者社区数据库文章正文

Impala是什么？

2017-11-07 3296

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

　　Impala是参照谷歌新三篇论文Dremel的开源实现，和Shark、Drill功能相似。Impala是Cloudera公司主导开发并开源。基于Hive并使用内存进行计算，兼顾数据仓库，具有实时、批处理、多并发等优点。是使用CDH的首选PB级大数据实时查询分析引擎。

　　谷歌旧三篇论文：mapreduce（mapreduce）、 bigtable（HBase）、 gfs（HDFS）

　　谷歌新三篇论文：Dremel（Impala）、Caffeine、Pergel。

　　同时，Impala由Cloudera公司开发，可以对存储在HDFS、HBase的海量数据提供交互式查询的SQL接口。除了和Hive使用相同的统一存储平台，Impala还提供了一个熟悉的面向批量或实时查询的统一平台。Impala的特点是查询非常迅速，其性能大幅领先于Hive。

　　注意：Impala并没有基于MapReduce的计算框架，这也是Impala可以大幅领先Hive的原因，Impala是定位是OLAP。

本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/6785177.html，如需转载请自行联系原作者

文章标签：

存储

大数据

SQL

HIVE

分布式计算

OLAP

Hbase

分布式数据库

技术小哥哥

目录

相关文章

aliyun7362823750

|

监控数据可视化项目管理

CM模式是什么？如何应用？

CM 模式（Construction Management）即建设管理模式，起源于20世纪60年代的美国，通过专业的建设管理团队在项目早期介入，优化设计方案，协调各方资源，有效提升项目质量和进度控制。该模式已广泛应用于各类建筑工程，并不断创新发展，适应数字化、绿色建筑及国际化需求。未来，CM模式将继续推动建筑行业的进步。

aliyun7362823750

1935 2 2

开发者百事通

|

弹性计算关系型数据库 Apache

基于ECS搭建云上博客

本场景将基于一台配置了CentOS 7.7操作系统的ECS实例（云服务器）。通过本教程的操作，您可以在一台CentOS 7.7操作系统的ECS实例上安装和部署LAMP环境，然后安装 WordPress，帮助您快速搭建自己的博客。

开发者百事通

2415 3 6

modelscope

|

机器学习/深度学习自然语言处理

Deepseek开源R1系列模型，纯RL助力推理能力大跃升！

近期Deepseek正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。

modelscope

3178 25 40

蓝易云

|

8月前

|

Ubuntu 机器人项目管理

Ubuntu系统更换软件源以及ROS包管理问题解析

以上是针对Ubuntu系统软件源的更换和ROS包管理的关键步骤。务必跟随官方指南，在安装或者配置过程中应答疑解惑，确保每一步操作的准确性。这些操作对于机器人研发人员和爱好者来说是日常任务的一部分，熟练掌握这些技能，能够在机器人编程和项目管理方面提供很大的帮助。

蓝易云

750 0 0

五十四

|

传感器机器学习/深度学习人工智能

多模态大模型

多模态大模型

五十四

896 1 1

1442834948473151

|

SQL 监控安全

sql数据库文件数据修复

当SQL数据库文件（如MDF、LDF等）损坏时，可能需要进行数据修复。以下是一些建议的步骤和策略，帮助你尝试修复SQL数据库文件中的数据： 1. **备份文件**：在进行任何修复操作之前，请

1442834948473151

1646 0 0

131王

|

缓存资源调度 Cloud Native

云原生架构下的性能优化实践与策略####

【10月更文挑战第26天】本文深入探讨了云原生环境下性能优化的核心原则与实战技巧，旨在为开发者和企业提供一套系统性的方法，以应对日益复杂的微服务架构挑战。通过剖析真实案例，揭示在动态扩展、资源管理、以及服务间通信等方面的常见瓶颈，并提出针对性的优化策略，助力企业在云端环境中实现更高效、更稳定的应用部署。 ####

131王

390 0 0

驰网飞飞

|

安全 Unix Linux

服务器怎么连接？服务器远程连接图文教程

服务器操作系统可以实现对计算机硬件与软件的直接控制和管理协调，任何计算机的运行离不开操作系统，服务器也一样，服务器操作系统主要分为四大流派：Windows Server、Netware、Unix和Linux。今天飞飞就给你们分享下常用的Windows、Linux、Unix三种系统的远程连接图文操作方法

驰网飞飞

7803 0 0

服务器怎么连接？服务器远程连接图文教程

小Lee

|

Java

java语言基础

java语言基础

小Lee

1528 0 0

困就想睡觉

|

Python

pygame

困就想睡觉

858 0 0

热门文章

最新文章

手把手教您将 Ghostscript 移植到函数计算平台

DataX 概述、部署、数据同步运用示例

如何编写.NET Core Global Tools (附两个案例)

一篇文章带你搞懂 this 的四个绑定规则 ✍

详细的正则表达式

javascript性能优化之事件委托

生成随机字符+数字的存储过程

***经典笔试题

java泛型学习3之类型参数的限制

Helloworld项目分析杂记一

开源 Wiki 神器 Docmost：团队协作知识库的终极解决方案

统一接口切换模型，靠 DМ‌XΑ‌РΙ 实战

必知必会：大模型训练显存计算与优化详解

Hermes Agent如何安装？手把手教你阿里云轻量和无影云电脑快速部署Hermes Agent

我用 OpenClaw 玩转漫评 skill：成为漫剧影评助手达人不是梦

保姆级教程：hermes agent如何安装？跟着教程操作新手也能一次成功

OpenClaw Windows 一键部署教程与安装步骤详解

Hermes Agent和OpenClaw有啥区别？谁是2026最强AI Agent？

【超级详细】MySQL下载 | MySQL安装教程 | MySQL数据库安装使用全攻略

Claude Opus 4.7 系统 Prompt 泄露：其中的10 个核心设计决策解读

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云重磅新品：Agent安全中心，全新安全框架下AI Agent一体化防御平台