基于mac构建大数据伪分布式学习环境（三）-配置免密登录并配置Hadoop-阿里云开发者社区

基于mac构建大数据伪分布式学习环境（三）-配置免密登录并配置Hadoop

2022-10-20 167

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： 本文主要讲解如何配置免密登录，并配置Hadoop

上传文件等操作，这里不再赘述

前置免密登录操作:

ssh-keygen -t rsa
ll ~/.ssh/
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

解压

tar -zxvf hadoop-3.2.0.tar.gz

配置环境变量

vi /etc/profile
exportPATH=.:$JAVA_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$PATH

修改配置文件

* hadoop-env.sh
```bashexport JAVA_HOME=/data/soft/jdk1.8export HADOOP_LOG_DIR=/data/hadoop_repo/logs/hadoop```* core-site.xml 
```xml<configuration>    <property>        <name>fs.defaultFS</name>        <value>hdfs://bigdata:9000</value>    </property>    <property>        <name>hadoop.tmp.dir</name>        <value>/data/hadoop_repo</value>   </property></configuration>```* hdfs-site.xml
```xml<configuration>    <property>        <name>dfs.replication</name>        <value>1</value>    </property></configuration>```* mapred-site.xml
```xml<configuration>    <property>        <name>mapreduce.framework.name</name>        <value>yarn</value>    </property></configuration>```* Yarn-site.xml
```xml<configuration>    <property>        <name>yarn.nodemanager.aux-services</name>        <value>mapreduce_shuffle</value>    </property>    <property>        <name>yarn.nodemanager.env-whitelist</name>   <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>    </property></configuration>```* Workers
```xmlbigdata```*

格式化hdfs

cd /data/soft/hadoop-3.2.0
bin/hdfs namenode -format

网络异常，图片无法展示

• 增加start-dfs.sh，stop-dfs.sh以及start-yarn.sh，stop-yarn.sh下的日志信息
• start-dfs.sh，stop-dfs.sh
HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
• start-yarn.sh，stop-yarn.sh
YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root
• 启动集群
start-all.sh

网络异常，图片无法展示

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

基于mac构建大数据伪分布式学习环境（三）-配置免密登录并配置Hadoop

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

基于mac构建大数据伪分布式学习环境（三）-配置免密登录并配置Hadoop

热门文章

最新文章

相关课程

相关电子书

相关实验场景