Hadoop优点/特性
Hadoop 是一个能够让用户轻松架构和使用的**分布式计算**的平台。用户可以轻松地在 Hadoop 发和运行处理海量数据的应用程序。其优点主要有以下几个:
(1) **高可靠性**:数据存储多个备份(默认存储3个副本,自己可以修改副本数量),集群设置在不同机器上,可以防止一个节点宕机造成集群损坏。当数据处理请求失败后,Hadoop会自动重新部署计算任务。Hadoop框架中有备份机制和校验模式,Hadoop会对出现问题的部分进行修复,也可以通过设置快照的方式在集群出现问题时回到之前的一个时间点。
(2) **高扩展性**:Hadoop 是在可用的计算机集群间分配数据并完成计算任务的。为集群添加新的节点并不复杂,所以集群可以很容易进行节点的扩展,扩大集群。
(3) **高效性**:Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。
(4) **高容错性**:Hadoop的分布式文件系统HDFS在存储文件时会在多个节点或多台机器上存储文件的备份副本,当读取该文档出错或者某一台机器宕机了,系统会调用其他节点上的备份文件,保证程序顺利运行。如果启动的任务失败,Hadoop会重新运行该任务或启用其他任务来完成这个任务没有完成的部分。
(5) **低成本**:Hadoop 是开源的,既不需要支付任何费用即可下载并安装使用,节省了软件购买的成本。
(6) **可构建在廉价的机器上**:Hadoop不要求机器的配置达到极高的水准,大部分普通商用服务器就可以满足要求,它通过提供多个副本和容错机制来提高集群的可靠性。
(7) **Hadoop基本框架用Java语言编写**:Hadoop含有使用Java语言编写的框架,因此运行在Linux生产平台上是非常理想的