mac osx 系统 brew install hadoop 安装指南

简介:
mac osx 系统 brew  install hadoop 安装指南
 
  1. brew install hadoop 
  2. 配置 core-site.xml:配置hdfs文件地址(记得chmod 对应文件夹,否则无法正常启动hdfs)和namenode的rpc通行端口
  3. 配置mapred-site.xml  中的map reduce通信端口
  4. 配置hdfs-site.xml 中的datanode 副本数。
  5. 格式化hdfs文件系统
  6. 启动Hadoop 和 yarn  namenode  datanode  mapred , 即:运行 start_all.sh
  7. (可选)在hdfs中创建当前用户的地址:  hadoop fs -mkdir -p /user/fan
  8. 开工,web ui 地址默认为:http://localhost:50070。
 
 
遇到的问题:
一, 如在hdfs -put ~/file  fileonhdfs 时, 出现error:WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Invalid directory in dfs.data.dir
          原因是:
  1.   core-site.xml中设置的文件系统已满,需重新设置,并再次-format。
  2.   core-site.xml中设置的hdfs文件系统所在文件夹需要chmod 777 
 
二, 如在hadoop fs -ls . 命令时出现: ls: '.': No such file or directory'
  1. 请执行: 
    hadoop fs -mkdir -p /user/[current login user]
 
 
 
配置文件demo:
 

配置core-site.xml、hdfs-site.xml、mapred-site.xml

* core-site.xml:

 

Xml代码  
  1. <configuration>  
  2.    
  3. <property>  
  4.   <name>hadoop.tmp.dir</name>  
  5.   <value>/usr/local/tmp/hadoop/hadoop-${user.name}</value>  
  6.   <description>A base for other temporary directories.</description>  
  7. </property>  
  8.    
  9. <property>  
  10.         <name>fs.default.name</name>  
  11.         <value>hdfs://localhost:8020</value>  
  12. </property>  
  13.    
  14. </configuration>  

 

 

* hdfs-site.xml:

 

Xml代码  
  1. <configuration>  
  2.    
  3.     <property>  
  4.         <name>dfs.replication</name>  
  5.         <value>1</value>  
  6.     </property>  
  7.    
  8. </configuration>  

 

 

* mapred-site.xml:

 

Xml代码  
  1. <configuration>  
  2.    
  3.     <property>  
  4.         <name>mapred.job.tracker</name>  
  5.         <value>localhost:8021</value>  
  6.     </property>  
  7.    
  8.     <property>  
  9.           
  10. </configuration>  

 

 

其实这些都是基本配置, 网上一大把。配置的值的说明可以参考这3个地址:

 

 写道
http://hadoop.apache.org/common/docs/r0.20.2/core-default.html
http://hadoop.apache.org/common/docs/r0.20.2/hdfs-default.html
http://hadoop.apache.org/common/docs/r0.20.0/mapred-default.html

 

 

2.3)格式化hadoop的文件系统hdfs。 执行命令 hadoop namenode -format 



本文转自fandyst 博客园博客,原文链接:http://www.cnblogs.com/ToDoToTry/    ,如需转载请自行联系原作者

相关文章
|
11月前
|
SQL 分布式计算 Hadoop
Hadoop生态系统:从小白到老司机的入门指南
Hadoop生态系统:从小白到老司机的入门指南
502 13
|
存储 分布式计算 Hadoop
基于Java的Hadoop文件处理系统:高效分布式数据解析与存储
本文介绍了如何借鉴Hadoop的设计思想,使用Java实现其核心功能MapReduce,解决海量数据处理问题。通过类比图书馆管理系统,详细解释了Hadoop的两大组件:HDFS(分布式文件系统)和MapReduce(分布式计算模型)。具体实现了单词统计任务,并扩展支持CSV和JSON格式的数据解析。为了提升性能,引入了Combiner减少中间数据传输,以及自定义Partitioner解决数据倾斜问题。最后总结了Hadoop在大数据处理中的重要性,鼓励Java开发者学习Hadoop以拓展技术边界。
455 7
|
NoSQL Shell MongoDB
Mac OSX 平台安装 MongoDB
10月更文挑战第11天
394 4
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
337 3
|
分布式计算 资源调度 Hadoop
centos7二进制安装Hadoop3
centos7二进制安装Hadoop3
|
存储 SQL 分布式计算
Hadoop生态系统概述:构建大数据处理与分析的基石
【8月更文挑战第25天】Hadoop生态系统为大数据处理和分析提供了强大的基础设施和工具集。通过不断扩展和优化其组件和功能,Hadoop将继续在大数据时代发挥重要作用。
|
分布式计算 Ubuntu Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
213 1
|
分布式计算 Hadoop Linux
Hadoop检查本地文件系统:
【7月更文挑战第24天】
261 6
|
分布式计算 Hadoop
|
存储 分布式计算 资源调度
Hadoop生态系统概览:从HDFS到Spark
【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它由多个组件构成,旨在提供高可靠性、高可扩展性和成本效益的数据处理解决方案。本文将介绍Hadoop的核心组件,包括HDFS、MapReduce、YARN,并探讨它们如何与现代大数据处理工具如Spark集成。
1101 0

相关实验场景

更多