阿里云
为了无法计算的价值
打开APP
阿里云APP内打开
学习中心> Hadoop快速入门> 正文

Hadoop快速入门

39课时 |
2042人已学 |
免费
课程介绍
介绍Hadoop是什么、发展历史、三大发行版本、优势、组成、Hadoop 1.x和2.x区别、大数据技术生态体系。
 
 
 

Hadoop的发展历史

 

内容简介:

  • 具体内容

 

 

一、具体内容

1) Lucene 框架是 Doug Cutting开创的开源软件,用Java书写代码,实现与 google类似的全文搜索功能,它提供了全文检索引擎的架构,包括完整的查査询引擎和索引引擎。

Hadoop创始人 Doug Cutting

 

2)2001年年底Lucene成为 Apache基金会的一个子项目。

 

  • 对于海量数据的场景, Lucene面对与 Google同样的困难,存储数据困难,检索速度慢。

 

  • 学习和模仿 Google解决这些问题的力法:微型版Nuth

 

5)可以说 Google是 Hadoop的思想之源( Google在大数据方面的三篇论文)

GFS --->HDFS

Map-Reduce-->MR

Big Table-->HBase

 

6)2003-2004年, Google公开了部分GFS和 MapReduce,思想的细节,以此为基础 Doug Cutting等人用了2年业余时间实现了DFS和 MapReduce机制,使 Nutch性能飙升。

 

7)2005年 Hadoop作为 Lucene的子项目Nutc的部分正式引入 Apache基金会。

 

8)2006年3月份, Map-Reduce和 Nutch Distributed File System(NDFS)分别被纳入称为 Hadoop的项中。

 

  • 名字来源于 Doug Cuttin儿子的玩具大象。Hadoop的ogo图片。

 

10)Hadoop就此诞生并迅速发展,标志着大数据时代来临。