Hadoop的话题系列

简介:

大家好,今天就市面上比较火热的云计算技术中最杰出的开源软件hadoop方面的话题,分享以下宅鸟在工作和学习中对hadoop的认识理解开发运维方面的理解。

首先由大家带着以下几个问题引出以后博文.

1、什么是云计算?

2、云计算在行业内存在方式?

3、hadoop为什么云计算方面的杰出代表?

4、怎样揭开hadoop神秘的面纱?

5、hadoop能给企业带来哪些好处?


如果大家对这些比较清楚,如果不太清楚的朋友可以在网上搜到很多这方面的介绍。

宅鸟希望给大家分享一些干货

6、hadoop集搭建

7、CDH4 搭建hadoop集

8、通过ganglia对整个hadoop集的监控

9、hadoop运维过程中需要注意哪些方面

...


本片作为hadoop系列的开篇索引,索引还会陆续更新


本文转自birdinroom 51CTO博客,原文链接:http://blog.51cto.com/birdinroom/1343104,如需转载请自行联系原作者


相关文章
|
分布式计算 资源调度 Hadoop
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(下)
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(下)
134 0
|
8月前
|
分布式计算 Hadoop 分布式数据库
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
225 2
|
分布式计算 资源调度 Hadoop
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
|
9月前
|
存储 分布式计算 负载均衡
干翻Hadoop系列文章【01】:Hadoop前瞻之分布式知识
干翻Hadoop系列文章【01】:Hadoop前瞻之分布式知识
|
存储 SQL 分布式计算
Hadoop 概述、Hadoop 发展历史、Hadoop 三大发行版本、Hadoop优势、Hadoop组成、Hadoop1.x、2.x、3.x区别、HDFS架构概述、大数据技术生态体系、推荐系统框架图
高可靠性、高扩展性、高效性、高容错性YARN架构概述、MapReduce架构概述、HDFS、YARN、MapReduce三者关系、1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。 2)DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。 3)Secondary NameNode(2nn):每隔一段时间对NameNode元数据备份。MapReduce将计算过程分为两个阶段:
Hadoop 概述、Hadoop 发展历史、Hadoop 三大发行版本、Hadoop优势、Hadoop组成、Hadoop1.x、2.x、3.x区别、HDFS架构概述、大数据技术生态体系、推荐系统框架图
|
分布式计算 Hadoop
Hadoop 入门到实践
Hadoop 入门到实践
120 0
Hadoop 入门到实践
|
存储 机器学习/深度学习 SQL
学完了Hadoop,我总结了这些重点
学完了Hadoop,我总结了这些重点
260 0
学完了Hadoop,我总结了这些重点
|
存储 缓存 监控
Hadoop-Flume基础理论入门(1)
Hadoop-Flume基础理论入门(1)
Hadoop-Flume基础理论入门(1)
|
SQL 资源调度 分布式计算
大数据技术之Hadoop3.x笔记
大数据技术之Hadoop3.x笔记
311 0
大数据技术之Hadoop3.x笔记
|
SQL 存储 缓存
与 hadoop 对比,如何看待 spark 技术?
我先说我个人的结论。 我的结论必须基于2017年9月初这个时间节点。因为未来,是存在一切可能的变数的。 1.Hive 在短期2-3年内,仍然无法被取代。大部分中大型互联网公司的sql类大数据分析job,70%以上都仍旧会跑在hive上。 2.presto / impala / sparksql / hive on tez . 我认为presto目前是最有可能胜出的一个。 3.spark 的地位有些尴尬。在大热之后,我不太看好他的未来。 我当然会慢慢来说我为什么会下这些结论。 首先,我在说几个我在工作当中看到的事实: 1.spark在小数据集的优势明显。 spark更容易编写类
209 0

相关实验场景

更多