什么是Hadoop
1.Hadoop是apache旗下的一套开源软件平台。
2.Hadoop提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。
3.Hadoop的核心组件有:
- HDFS(分布式文件系统)
- YARN(运算资源调度系统)
- MAPREDUCE(分布式运算编程框架)
4.广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。
Hadoop产生背景
Hadoop在大数据、云计算中的位置和关系
1.云计算是分布式计算、并行计算、网格计算、多核计算、网络存储、虚拟化、负载均衡等传统计算机技术和互联网技术融合发展的产物。借助IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等业务模式,把强大的计算能力提供给终端用户。
2.现阶段,云计算的两大底层支撑技术为 “虚拟化” 和 “大数据技术”。
3.而Hadoop则是云计算的PaaS层的解决方案之一,并不等同于PaaS,更不等同于云计算本身