hadoop

简介: 一、概述   what is apache hadoop?     The apache Hadoop project develops open-source software for reliable, scalable, distributed computing.

一、概述

  what is apache hadoop?

    The apache Hadoop project develops open-source software for reliable, scalable, distributed computing.

  解决问题:

    1、海量数据的存储(HDFS)

    2、海洋数据的分析(MapReduce)

 hadoop具体能干什么?

  1、日志分析;facebook用Hive进行日志分析,yahoo使用hadoop的pig进行垃圾邮件识别和过滤,以及用户特征建模;

  

 

相关文章
|
SQL 存储 分布式计算
hadoop的特点
hadoop的特点
|
11月前
|
XML 分布式计算 Hadoop
hadoop
hadoop
1089 0
|
3月前
|
存储 分布式计算 Hadoop
深入理解Hadoop中的SequenceFileInputFormat
【8月更文挑战第31天】
79 0
|
机器学习/深度学习 存储 SQL
Hadoop
Hadoop组成
206 0
|
分布式计算 资源调度 Java
Hadoop3.2.0使用详解
Hadoop3.2.0使用详解1.概述Hadoop3已经发布很久了,迭代集成的一些新特性也是很有用的。截止本篇博客书写为止,Hadoop发布了3.2.0。接下来,笔者就为大家分享一下在使用Hadoop3中遇到到一些问题,以及解决方法。
3599 0
|
存储 分布式计算 大数据
hadoop介绍
以下内容是我的学习笔记,网络课程的笔记。出处 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。
2751 0
|
分布式计算 Hadoop
Hadoop DistributedCache详解(转载)
转自:http://dongxicheng.org/mapreduce-nextgen/hadoop-distributedcache-details/
787 0
|
分布式计算 资源调度 Hadoop
|
分布式计算 监控 Hadoop
|
分布式计算 资源调度 监控

相关实验场景

更多
下一篇
无影云桌面