hadoop服务组件简单解释
1、core 分布式系统和通用IO组件和接口(序列化、java远程调用等等服务)
2、avro 支持跨语言过程调用,持久数据存储的数据序列化系统
3、MapReduce 构建在廉价的pc机器上分布式数据处理模型和运行环境
4、hdfs 构建廉价的pc机器上分布式文件系统
5、pig 处理海量数据集的数据流语言和运行环境 ,pig运行在HDFS和MapReduce之上
6、HBase 分布式面向列的数据库 ,HBase使用HDFS作为底层存储, 同时使用MapReduce支持批处理模式的计算机和随机查询
7、 Zookeeper 提供分布式、高效的协作服务以及分布式锁这样的原子操作、可以用来构建分布式应用
8、hive 分布式数据仓库 、 Hive使用Hdfs存储数据,提供类似sql的语句(转换为MapReduce任务) 查询数据
9、chukwa 分布式数据采集和分析系统 、 使用HDFS 存储数据 、 使用MapReduce输出分析报告