文档备案控制台

开发者社区大数据文章正文

单机版 hadoop 云平台（伪分布式）搭建统计单词

2022-10-27 388

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 作者主页：https://www.couragesteak.com/

1.首先需要配置java环境

CentOS安装java jdk教程

2.上传hadoop到/usr/local目录并解压

cd /usr/local

ls

linux上传下载文件教程
在这里插入图片描述

3.配置hadoop环境目录

vim /etc/profile

#java environment
export JAVA_HOME=/usr/local/jdk1.8.0_151
export JRE_HOME=/usr/local/jdk1.8.0_151/jre
#export PATH=$PATH:/usr/local/jdk1.8.0_151/bin
export CLASSPATH=./:$JAVA_HOME/lib:$JRE_HOME/lib

#hadoop environment
export HADOOP_HOME=/usr/local/hadoop-2.8.4
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:

4.在hadoop配置文件配置java jdk

vim /usr/local/hadoop-2.8.4/etc/hadoop/hadoop-env.sh

source /usr/local/hadoop-2.8.4/etc/hadoop/hadoop-env.sh

# The java implementation to use.
export JRE_HOME=/usr/local/jdk1.8.0_151

5.查看

which hadoop

hadoop version

在这里插入图片描述

6.统计单词

这里统计的是 /root/input/a.txt 文件，并且将结果存放到 /root/output 目录

hadoop jar /usr/local/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /root/input/a.txt /root/output

7.查看结果

cd /root/output

在这里插入图片描述
如需转载请标明出处,有兴趣可以加q群交流779133600

文章标签：

Java

分布式计算

Linux

Hadoop

关键词：

hadoop单词

云平台统计

单机hadoop伪分布

有勇气的牛排

目录

相关文章

yuanzhengme

|

分布式计算 Hadoop 测试技术

Hadoop【环境搭建 05】【hadoop-3.1.3 单机版基准测试 TestDFSIO + mrbench + nnbench + Terasort + sort 举例】

【4月更文挑战第1天】Hadoop【环境搭建 05】【hadoop-3.1.3 单机版基准测试 TestDFSIO + mrbench + nnbench + Terasort + sort 举例】

yuanzhengme

832 3 3

yuanzhengme

|

分布式计算资源调度 Hadoop

Hadoop【问题记录 02】【hadoop-3.1.3 单机版】ResourceManager无法启动NodeManager启动后过自动关闭 javax/activation/DataSource

【4月更文挑战第2天】Hadoop【问题记录 02】【hadoop-3.1.3 单机版】ResourceManager无法启动NodeManager启动后过自动关闭 javax/activation/DataSource

yuanzhengme

653 2 2

蓝易云

|

存储分布式计算算法

探索Hadoop的三种运行模式：单机模式、伪分布式模式和完全分布式模式

在配置Hadoop集群之前，了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况，选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段，单机模式和伪分布式模式能为用户提供便利和成本效益。进而，当用户要处理大规模数据集时，完全分布式模式将是理想的选择。

蓝易云

1506 2 2

JavaPub

|

分布式计算 Hadoop Java

运行Hadoop自带的wordcount单词统计程序

运行Hadoop自带的wordcount单词统计程序

JavaPub

818 3 3

小竹笋

|

XML 分布式计算 Hadoop

分布式系统详解--框架（Hadoop-单机版搭建）

分布式系统详解--框架（Hadoop-单机版搭建）

小竹笋

273 0 0

分布式系统详解--框架（Hadoop-单机版搭建）

幼稚十一

|

存储分布式计算 Hadoop

【分布式计算框架】Hadoop伪分布式安装

【分布式计算框架】Hadoop伪分布式安装

幼稚十一

360 2 2

橙子先生

|

分布式计算资源调度 Hadoop

hadoop的伪分布式搭建-带网盘

hadoop的伪分布式搭建-带网盘

橙子先生

295 3 3

小竹笋

|

分布式计算资源调度 Java

Scala+Spark+Hadoop+IDEA实现WordCount单词计数，上传并执行任务（简单实例-下）

Scala+Spark+Hadoop+IDEA实现WordCount单词计数，上传并执行任务（简单实例-下）

小竹笋

315 0 0

小竹笋

|

分布式计算 Hadoop Scala

Scala +Spark+Hadoop+Zookeeper+IDEA实现WordCount单词计数（简单实例-上）

Scala +Spark+Hadoop+Zookeeper+IDEA实现WordCount单词计数（简单实例-上）

小竹笋

360 0 0

_BugMan

|

分布式计算 Hadoop 大数据

【大数据】Hadoop下载安装及伪分布式集群搭建教程

【大数据】Hadoop下载安装及伪分布式集群搭建教程

_BugMan

886 0 0

热门文章

最新文章

基于MongoDB的高并发高可用政府云平台架构实践

使用VMware Workstation搭建先电IaaS2.4云平台（上）

使用VMware Workstation搭建先电IaaS云平台（v2.2版本）（上）

【Kubesphere 云平台使用、具备两地三中心与三地五中心容灾架构实战】

openstack 云平台API

现代云平台技术及其应用

使用阿里云服务器迁移中心SMC将其他云平台业务迁移至阿里云教程参考

云原生分布式操作系统营造法式-云平台提供商视角

百万广告屏上IoT云平台，上海分泽时代降低运维成本30%

mPaaS云平台运维系列之—移动推送常见问题

Ubuntu22.04下搭建Hadoop3.3.6+Hbase2.5.6+Phoenix5.1.3开发环境的指南

CentOS中构建高可用Hadoop 3集群

“Hadoop整不明白，数据分析就白搭？”——教你用Hadoop撸清大数据处理那点事

Hadoop生态系统：从小白到老司机的入门指南

从“笨重大象”到“敏捷火花”：Hadoop与Spark的大数据技术进化之路

Dataphin功能Tips系列（41）-Hadoop集群管理

【赵渝强老师】史上最详细：Hadoop HDFS的体系架构

从Excel到Hadoop：数据规模的进化之路

MPP 架构与 Hadoop 架构技术选型指南

基于Java的Hadoop文件处理系统：高效分布式数据解析与存储

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop企业优化及扩展案例

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》

零基础实现hadoop 迁移 MaxCompute 之数据

CIO 指南:如何在SAP软件架构中使用Hadoop

相关实验场景

更多

搭建Hadoop环境

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！