02 Hadoop介绍

简介: 02 Hadoop介绍

什么是Hadoop

1.Hadoop是apache旗下的一套开源软件平台

2.Hadoop提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。

3.Hadoop的核心组件有:

  • HDFS(分布式文件系统)
  • YARN(运算资源调度系统)
  • MAPREDUCE(分布式运算编程框架)

4.广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。

Hadoop产生背景

Hadoop在大数据、云计算中的位置和关系

1.云计算是分布式计算、并行计算、网格计算、多核计算、网络存储、虚拟化、负载均衡等传统计算机技术和互联网技术融合发展的产物。借助IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)等业务模式,把强大的计算能力提供给终端用户。

2.现阶段,云计算的两大底层支撑技术为 “虚拟化” 和 “大数据技术”。

3.而Hadoop则是云计算的PaaS层的解决方案之一,并不等同于PaaS,更不等同于云计算本身

目录
相关文章
|
XML 分布式计算 Hadoop
hadoop
hadoop
1123 0
|
5月前
|
分布式计算 资源调度 Hadoop
Hadoop 2.0 与 Hadoop 1.x 有何不同?
【8月更文挑战第12天】
115 4
|
5月前
|
存储 分布式计算 Hadoop
深入理解Hadoop中的SequenceFileInputFormat
【8月更文挑战第31天】
101 0
|
SQL 数据采集 分布式计算
Hadoop01【介绍】
HADOOP是apache旗下的一套开源软件平台,HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理
Hadoop01【介绍】
|
分布式计算 资源调度 Java
Hadoop3.2.0使用详解
Hadoop3.2.0使用详解1.概述Hadoop3已经发布很久了,迭代集成的一些新特性也是很有用的。截止本篇博客书写为止,Hadoop发布了3.2.0。接下来,笔者就为大家分享一下在使用Hadoop3中遇到到一些问题,以及解决方法。
3607 0
|
分布式计算 Java Hadoop
|
分布式计算 算法 大数据
|
JSON 分布式计算 Java

相关实验场景

更多