Impala之Impalad进程

简介:         Impalad进程是Impala的核心组件,它是运行在集群中每个Impala节点上的一个守护进程。它主要负责:         1、从HDFS或HBase中读、写数据;         2、接收来自JDBC、Impala Shell等客户端命令;         3、并...

        Impalad进程是Impala的核心组件,它是运行在集群中每个Impala节点上的一个守护进程。它主要负责:

        1、从HDFS或HBase中读、写数据;

        2、接收来自JDBC、Impala Shell等客户端命令;

        3、并行化执行查询语句,分发到Impala集群中其它节点,并将查询中间结果汇报到中央协调节点Impalad进程;

        4、定时与statestore通讯,以确定哪些节点是健康的,可以接受新的工作;

        5、接收catalogd守护进程(Impala 1.2中引入)的广播,广播信息包括集群中任意Impala节点上创建、修改、删除任意类型的对象,或者通过Impala执行的INSERT、 LOAD DATA语句。


        在执行查询时,可以向Impala集群中任一节点上Impalad守护进程提交查询,这一节点便会成为整个查询的协调器节点,其他节点将查询的结果汇报汇聚到该协调节器节点,构成最终的查询结果。也可以采用一定算法负载均衡地向各个节点Impalad守护进程提交查询。


        

相关文章
|
6月前
|
SQL 存储 分布式计算
bigdata-29-Impala初步了解
bigdata-29-Impala初步了解
49 0
|
6月前
|
SQL 存储 分布式计算
Apache Impala(demo)
Apache Impala(demo)
95 0
|
6月前
|
SQL 分布式计算 Hadoop
Apache Impala 的安装部署
Apache Impala 的安装部署
220 0
|
安全 网络安全 数据安全/隐私保护
Cydia Impactor 常见报错及原因
Cydia Impactor 常见报错及原因
359 0
|
SQL 缓存 HIVE
Impala MetaData问题
Impala MetaData问题
255 0
|
SQL 存储 分布式计算
Impala 架构了解
Impala 架构了解
Impala 架构了解
|
SQL 分布式计算 Java
KuduSpark_Impala 访问 Kudu | 学习笔记
快速学习 KuduSpark_Impala 访问 Kudu
315 0
KuduSpark_Impala 访问 Kudu | 学习笔记
|
SQL XML 分布式计算
CDH 搭 建_Impala|学习笔记
快速学习 CDH 搭 建_Impala
488 0
CDH 搭 建_Impala|学习笔记
|
SQL Java 数据库连接
JDBC 操作 impala | 学习笔记
快速学习 JDBC 操作 impala
1025 0
JDBC 操作 impala | 学习笔记
Impala——2.架构
标签(空格分隔): Impala Impala Server的组件 Impala服务器是分布式,大规模并行处理(MPP)数据库引擎。它由不同的在群集中的特定主机上运行的守护程序进程组成。 Impala守护进程 核心Impala组件是一个守护进程,它通过impalad进程在集群的每个DataNode上运行。
1733 0