02 Hadoop介绍

简介: 02 Hadoop介绍

什么是Hadoop

1.Hadoop是apache旗下的一套开源软件平台

2.Hadoop提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。

3.Hadoop的核心组件有:

  • HDFS(分布式文件系统)
  • YARN(运算资源调度系统)
  • MAPREDUCE(分布式运算编程框架)

4.广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。

Hadoop产生背景

Hadoop在大数据、云计算中的位置和关系

1.云计算是分布式计算、并行计算、网格计算、多核计算、网络存储、虚拟化、负载均衡等传统计算机技术和互联网技术融合发展的产物。借助IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等业务模式,把强大的计算能力提供给终端用户。

2.现阶段,云计算的两大底层支撑技术为 “虚拟化” 和 “大数据技术”。

3.而Hadoop则是云计算的PaaS层的解决方案之一,并不等同于PaaS,更不等同于云计算本身

目录
相关文章
|
3月前
|
存储 分布式计算 Hadoop
深入理解Hadoop中的SequenceFileInputFormat
【8月更文挑战第31天】
77 0
|
存储 分布式计算 资源调度
Hadoop构成
Hadoop构成
36 0
|
SQL 数据采集 分布式计算
Hadoop01【介绍】
HADOOP是apache旗下的一套开源软件平台,HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理
Hadoop01【介绍】
|
存储 分布式计算 大数据
|
分布式计算 Hadoop
Hadoop DistributedCache详解(转载)
转自:http://dongxicheng.org/mapreduce-nextgen/hadoop-distributedcache-details/
786 0
|
分布式计算 资源调度 Hadoop
|
存储 分布式计算 大数据
|
SQL 分布式计算 大数据
|
分布式计算 NoSQL 大数据
|
分布式计算 大数据 Hadoop

相关实验场景

更多
下一篇
无影云桌面