Hadoop学习(一) MAC OS下安装Hadoop开发环境

简介: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

在MAC OS下安装和配置Hadoop开发环境相当简单。

先去下载最新稳定版本的Hadoop的文件包,下载地址为:
http://mirror.bjtu.edu.cn/apache/hadoop/common/hadoop-1.0.3/hadoop-1.0.3-bin.tar.gz

下载后解压复制到/Users 路径下。

在/Users/hadoop-1.0.3/conf 路径下修改以下四个文件:

  1. core-site.xml 在段中增加

      <name>fs.default.name</name>  
      <value>localhost:9000</value>  

  2. hdfs-site.xml 在段中增加

      <name>dfs.replication</name>  
      <value>1</value>  

表示使用hdfs分布是文件系统,复制份数为1,在单机上运行。

  1. mapred-site.xml 在段中增加

    <name>mapred.job.tracker</name>  
    <value>localhost:9001</value>  

表示在本机执行jobtracker进程。

  1. hadoop-env.sh 增加以下环境变量

    export JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6.0/Home

    export HADOOP_INSTALL=/Users/hadoop-1.0.3

    export PATH=$PATH:$HADOOP_INSTALL/bin

在MAC OS的系统偏好设置-共享中,允许远程登陆,打开ssh访问。

打开终端,进入/Users/hadoop-1.0.3 路径,执行:

bin/hadoop namenode -format

初始化hdfs文件系统。

最后启动Hadoop。

bin/start-all.sh 

执行jps命令可以查看运行中的Hadoop进程。

通过页面http://localhost:50070 可以查看Hadoop运行状态。

目录
相关文章
|
5月前
|
iOS开发 MacOS
MAC OS更新系统后IDEA中的SVN报错无法使用
MAC OS更新系统后IDEA中的SVN报错无法使用
|
11天前
|
存储 监控 安全
|
13天前
|
分布式计算 Hadoop Linux
找到Hadoop的安装目录
【4月更文挑战第19天】具体的安装目录可能因您的安装方式和环境而有所不同。如果您在安装Hadoop时遵循了特定的教程或文档,建议参考该教程或文档中的安装目录信息。
11 3
|
14天前
|
分布式计算 Hadoop 大数据
[大数据] mac 史上最简单 hadoop 安装过程
[大数据] mac 史上最简单 hadoop 安装过程
|
19天前
|
资源调度
Hadoop3的安装
Hadoop3的安装
18 0
|
23天前
|
存储 算法 Shell
操作系统(1)——学习导论(Ⅲ)
操作系统(1)——学习导论(Ⅲ)
|
23天前
|
存储 缓存 编解码
操作系统(1)——学习导论(Ⅰ)
操作系统(1)——学习导论(Ⅰ)
|
24天前
|
分布式计算 Hadoop 大数据
Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】
【4月更文挑战第5天】Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】
46 5
|
29天前
|
分布式计算 Hadoop Java
centos 部署Hadoop-3.0-高性能集群(一)安装
centos 部署Hadoop-3.0-高性能集群(一)安装
24 0
|
3月前
|
数据安全/隐私保护 iOS开发 MacOS