MapReduce 是一种算法,用于超大型数据集的并行运算;
HDFS 支持千万级的大型分布式文件系统;
HBase 是一个面向列的分布式数据库;
Hive 是DataWareHouse 和 Map Reduce交集,适用于ETL方面的工作;
Zookeeper 提供的功能包括:配置维护、名字服务、分布式同步、组服务等,用于分布式系统的可靠协调系统;
Pig 是在MapReduce上构建的查询语言(SQL-like),适用于大量并行计算;
Chukwa 是基于Hadoop集群中监控系统;
Avro 是一个数据序列化系统,设计用于支持大批量数据交换的应用。