MacOs首次安装单机Hadoop

简介: Apache Hadoop项目为可靠、可扩展的分布式计算开发开源软件。Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。(原文翻译)访问:https://hadoop.apache.org/安装设备个人macbookpro Mac-Os11+
Hadoop是个存储数据,计算数据的分布式框架。核心组件是HDFS、MapReduce、Yarn。
HDFS:分布式存储
MapReduce:分布式计算
Yarn:调度MapReduce

我的操作系统

image.png

安装Hadoop


1.安装Jdk

下载并安装
https://www.oracle.com/java/technologies/downloads/

下载自行操作

安装:
解压命令参考:tar -zxvf jdk-xxxx-linux-x64.tar.gz
加入环境变量:vi /etc/profile
生效命令:source  /etc/profile
验证安装

image.png


2.安装Hadoop

选择一个release版本

https://hadoop.apache.org/releases.html

下载

image.png

tar xzf hadoop-3.2.3.tar.gz

解压结果如下

image.png


配置本机ssh
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys


配置Hadoop环境变量
cat hadoop-3.2.3/etc/hadoop/hadoop-env.sh


image.png


配置hdfs地址
vi hadoop-3.2.3/etc/hadoop/core-site.xml 

image.png

配置hafs分片数
vi hadoop-3.2.3/etc/hadoop/hdfs-site.xml


image.png

配置mapreduce


vi hadoop-3.2.3/etc/hadoop/mapred-site.xml
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.application.classpath</name>
        <value>$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*</value>
    </property>
配置yarn
vi hadoop-3.2.3/etc/hadoop/mapred-site.xml
<!-- configuration 中添加以下配置  -->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_HOME,PATH,LANG,TZ,HADOOP_MAPRED_HOME</value>
    </property>


配置User

在sbin/start-dfs.sh,sbin/stop-dfs.sh两个文件顶部添加以下参数

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root



在sbin/start-yarn.sh,sbin/stop-yarn.sh顶部也需添加以下

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root
初始化hdfs
cd hadoop-3.2.3/bin/ 
直接命令:  hdfs namenode -format
  • 如果前的xxx-site.xml配置出现问题就会报错,根据错误信息来解决。


启动yarn
cd hadoop-3.2.3/sbin
//执行下面start的命令
start-yarn.sh

查看进程

image.png

启动hdfs
cd hadoop-3.2.3/sbin
start-dfs.sh


JPS进程查看:

image.png

3.成功安装

访问Hadoop

http://localhost:9870/dfshealth.html#tab-overview

image.png



访问集群:

http://localhost:8088/cluster/cluster

image.png


QA

1.参考命令:

现在检查您是否可以在没有密码的情况下 ssh 到 localhost:
$ ssh 本地主机
//执行以下命令操作
$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
$ chmod 0600 ~/.ssh/authorized_keys

2.mac电脑的配置

一定要开启共享,如果不开会报如下错误:

ssh: connect to host localhost port 22: Connection refused

解决办法是开始共享

image.png







目录
相关文章
|
2月前
|
分布式计算 资源调度 Hadoop
centos7二进制安装Hadoop3
centos7二进制安装Hadoop3
|
2月前
|
存储 分布式计算 算法
探索Hadoop的三种运行模式:单机模式、伪分布式模式和完全分布式模式
在配置Hadoop集群之前,了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况,选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段,单机模式和伪分布式模式能为用户提供便利和成本效益。进而,当用户要处理大规模数据集时,完全分布式模式将是理想的选择。
79 2
|
2月前
|
分布式计算 Ubuntu Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
23 1
|
3月前
|
SQL 分布式计算 关系型数据库
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
47 2
|
4月前
|
XML 分布式计算 Hadoop
分布式系统详解--框架(Hadoop-单机版搭建)
分布式系统详解--框架(Hadoop-单机版搭建)
67 0
分布式系统详解--框架(Hadoop-单机版搭建)
|
5月前
|
弹性计算 分布式计算 Hadoop
Linux(阿里云)安装Hadoop(详细教程+避坑)
Linux(阿里云)安装Hadoop(详细教程+避坑)
794 3
|
4月前
|
分布式计算 Hadoop 大数据
【大数据】Hadoop下载安装及伪分布式集群搭建教程
【大数据】Hadoop下载安装及伪分布式集群搭建教程
162 0
|
5月前
|
存储 分布式计算 Hadoop
【分布式计算框架】Hadoop伪分布式安装
【分布式计算框架】Hadoop伪分布式安装
43 2
|
5月前
|
分布式计算 资源调度 Hadoop
安装hadoop学习笔记
安装hadoop学习笔记
59 0
安装hadoop学习笔记
|
5月前
|
分布式计算 Hadoop Java
hadoop的基础设施-protobuf-2.5.0编译和安装
hadoop的基础设施-protobuf-2.5.0编译和安装
42 0
下一篇
无影云桌面