大数据实战平台环境搭建（上）-阿里云开发者社区

大数据实战平台环境搭建（上）

2024-05-13 160

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 大数据实战平台环境搭建（上）

一、创建 Hadoop 用户

1、创建 Hadoop 用户，输入最开始的密码

图1：创建 Hadoop 用户

打开Ubuntu终端Terminal运行sudo useradd -m hadoop -s /bin/bash用于创建用户，系统需要等待我们输入密码（注意的是Ubuntu终端输入密码是不会显示的）。输入完密码后重新弹出nuyoah@nuyoah-VirtualBox:-$这个才算创建成功。

2、设置Hadoop账户密码

图2：设置Hadoop账户密码

在Ubuntu终端输入sudo passwd hadoop为Hadoop账号设置账号密码，通过输入和确认密码完成对于Hadoop账号密码的设置。

3、赋权

图3：为Hadoop用户赋权

在Ubuntu终端输入sudo adduser hadoop sudo为Hadoop用户赋权

二、更新apt和安装Vim编辑器

1、切换Hadoop用户，并输入密码

图4：切换Hadoop用户，并输入密码

在Ubuntu终端输入su hadoop切换成hadoop用户。

（必须切换到hadoop用户，不然后面会有问题。）

2、更新 apt

图5：更新apt

首先要确认已经切换到了hadoop用户，接着在终端输入sudo apt-get update使得hadoop用户更新apt，为接下来下载vim做准备。

3、安装 vim 编辑器

图6：安装vim编译器

在终端输入sudo apt-get install vim下载vim编译器。（vim编译器的作用：创建、维护或修改文本文件，维护Linux系统中的各种配置文件。）

当出现Do you want to continue?的时候需要我们输入y进行确认。（这里大小写都可以。）

图7：vim编译器安装完成

三、安装 SSH 和配置 SSH 无密码登录

1、安装 SSH 服务端

图8：安装 SSH 服务端

在终端输入sudo apt-get install openssh-server安装openssh。（OpenSSH 是 SSH （Secure SHell）协议的免费开源实现OpenSSH提供了服务端后台程序和客户端工具，用来加密远程控制和文件传输过程中的数据，并由此来代替原来的类似服务。）

当出现Do you want to continue?的时候需要我们输入y进行确认。（这里大小写都可以。）

图9： SSH 服务端安装完成

2、登录本机

图10：登录本机

在终端输入ssh localhost请求登录本机。注意这里的确认要填的是yes。

图11：输入hadoop用户密码

图12：成功登录本机

3、配置无密码登录

图13：退出openssh并进去ssh文件夹

在终端输入exit退出openssh，当出现Connection to localhost closed.表示成功退出openssh。接着在终端输入cd ~/.ssh/进入ssh文件夹内。

图14：生成密钥并保存

在终端输入ssh-keygen -t rsa生成密钥，接着要等相关指令出来后按enter回车键（一共三次）。完成后我们能看到密钥和公钥都保存在了/home/hadoop/.ssh/里面。

图15：查看/.ssh下的文件

在终端输入ll查看/.ssh下的所有文件，确保密钥和公钥都保存在了这里。

4、确认配置成功

图16：确认配置成功

在终端输入cat ./id_rsa.pub >> ./authorized_kays加入授权，接着输入ssh localhost测试无密码登录ssh，最后输入exit退出ssh。

四、安装 Java

1、拖拽安装包到 downloads

图17：将下载好的安装包拖拽到 Downloads

图18：成功拖拽安装包到 Downloads

2、Hadoop用户下进入Downloads文件夹

图19：查看Downloads文件夹位置

注意要在Hadoop用户下进入Downloads。（在Ubuntu终端输入su hadoop切换成hadoop用户。）

我这里是将安装包保存在nuyoah/Downloads下。（注意nuyoah是我最开始设置的用户名）通过终端输入ll查看downloads文件夹位置。

图20：进入Downloads文件夹

进入Downloads文件夹后，在终端输入ll确认Downloads文件夹有刚刚拖进来的安装包。

3、创建jvm文件夹

图21：创建jvm文件夹

在终端输入sudo mkdir /usr/lib/jvm创建jvm文件夹。（出现Permission denied错误表示要在指令前加“sudo”。）

4、将:JDK安装包复制到 jvm 文件夹下

图22：将:JDK安装包复制到 jvm 文件夹

在终端输入sudo cp jdk-8u211-linux-x64.gz /uer/lib/jvm复制JDK安装包到 jvm 文件夹，其中sudo是给权限，cp是复制，jdk-8u211-linux-x64.gz是要复制的文件名，/uer/lib/jvm是要复制到的路径。在终端输入cd /uer/lib/jvm以及ll到目标文件夹下查看是否完成复制。

5、解压

图23：解压jdk

在终端输入sudo tar -zxvf ./jdk-8u211-linux-x64.gz -C /uer/lib/jvm解压指令对jdk文件解压。（-zxvf ：z代表gzip的压缩包；x代表解压；v代表显示过程信息；f代表后面接的是文件）

需要记住jdk1.8.0_211/这个文件夹，后面环境配置时需要。

图24：解压完成

图25：确认解压是否成功

在终端输入cd jdk1.8.0_211/进入该文件夹确认解压是否成功，如果该文件夹为空则前面某一步有问题导致解压不成功，反之则为解压成功。

6、配置环境变量

图26：进入环境变量配置

在终端输入cd …返回上一级文件夹，再输入vim ~/.bashrc进入环境变量配置。

图27：进入环境变量

进入环境变量，此时补课编辑，只可查看。需要按“i”进入 insert 模式。

图28：配置环境变量

图29：按 ESC 保存，然后 shift+：wq

按 ESC 保存，然后 shift+：wq退出环境配置。

图30：确认jdk安装成功

在终端输入source ~/.bashrc激活刚刚配置的环境变量，接着在终端输入java -version查看java版本，确认jdk安装成功。

五、安装单机 Hadoop

1、确认文件及文件夹

图31：确认文件及文件夹

在终端进入Downloads文件夹确认hadoop的安装包在该文件夹内。

2、解压安装包到/usr/local下

图32：解压安装包到/usr/local

在终端输入sudo tar -zxvf hadoop-3.1.3.tar.gz -C /uer/local解压指令对hadoop文件解压。（-zxvf ：z代表gzip的压缩包；x代表解压；v代表显示过程信息；f代表后面接的是文件）

图33:解压完成

Hadoop安装包解压完成，其中hadoop-3.1.3/是解压后的文件夹的名称。

在终端输入cd /uer/local进入local文件夹，通过ll查看改文件夹内的文件。为了方便，通过输入sudo mv ./hadoop-3.1.3/ ./hadoop将文件夹hadoop-3.1.3的名字改成了hadoop。通过输入sudo chown -R hadoop ./hadoop修改权限。

4、查看版本信息