文档备案控制台

开发者社区华章出版社文章正文

《Hadoop与大数据挖掘》一2.3.3　MapReduce常用命令mapred job

2017-06-26 1790

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章，第2.3.3节，张良均　樊　哲　位文超　刘名军许国杰　周　龙　焦正升　著更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3.3　MapReduce常用命令mapred job

MapReduce常用命令就是job相关命令，该命令相关参数及描述如代码清单2-20所示。

代码清单2-20　mapred job 命令
[root@master hadoop-2.6.0]# bin/mapred job
Usage: CLI <command> <args>
[-submit <job-file>]
[-status <job-id>]
[-counter <job-id> <group-name> <counter-name>]
[-kill <job-id>]
[-set-priority <job-id> <priority>]. Valid values for priorities are: VERY_HIGH HIGH NORMAL LOW VERY_LOW
[-events <job-id> <from-event-#> <#-of-events>]
[-history <jobHistoryFile>]
[-list [all]]
[-list-active-trackers]
[-list-blacklisted-trackers]
[-list-attempt-ids <job-id> <task-type> <task-state>]. Valid values for <task-type> are REDUCE MAP. Valid values for <task-state> are running, completed
[-kill-task <task-attempt-id>]
[-fail-task <task-attempt-id>]
[-logs <job-id> <task-attempt-id>]

其中比较常用的描述如下。

-list：列出所有任务信息；
-kill：杀死执行任务id的任务，当知道提交的任务有问题的时候，可以运行此命令，直接关闭对应的任务；
-logs：查看某个任务的日志，用得相对较少，如果要查看日志，可以首选浏览器查看，其显示格式比较好。

文章标签：

云原生大数据计算服务 MaxCompute

JavaScript

监控

Web App开发

大数据

分布式计算

关键词：

hadoop mapreduce

云原生大数据计算服务 MaxCompute mapreduce

大数据mapreduce

hadoop命令

mapreduce hadoop

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

华章计算机

目录

相关文章

武子康

|

分布式计算资源调度 Hadoop

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

武子康

555 2 2

你都不懂

|

关系型数据库大数据 Linux

linux命令-查看当前目录当前目录剩余空间以及目录文件大小和个数（pg清理大数据量表）

【7月更文挑战第28天】

你都不懂

2302 6 6

尹正杰

|

资源调度分布式计算 Hadoop

使用YARN命令管理Hadoop作业

本文介绍了如何使用YARN命令来管理Hadoop作业，包括查看作业列表、检查作业状态、杀死作业、获取作业日志以及检查节点和队列状态等操作。

尹正杰

866 1 1

使用YARN命令管理Hadoop作业

武子康

|

分布式计算资源调度 Hadoop

Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化编写Mapper和Reducer和Driver 附带POM 详细代码图文等内容

Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化编写Mapper和Reducer和Driver 附带POM 详细代码图文等内容

武子康

436 3 3

武子康

|

分布式计算监控 Hadoop

Hadoop-29 ZooKeeper集群 Watcher机制工作原理与 ZK基本命令测试集群效果 3台公网云服务器

Hadoop-29 ZooKeeper集群 Watcher机制工作原理与 ZK基本命令测试集群效果 3台公网云服务器

武子康

369 1 1

william.zhang(张)

|

分布式计算资源调度 Hadoop

Hadoop入门基础（五）：Hadoop 常用 Shell 命令一网打尽，提升你的大数据技能！

Hadoop入门基础（五）：Hadoop 常用 Shell 命令一网打尽，提升你的大数据技能！

william.zhang(张)

911 2 2

土木林森

|

分布式计算大数据分布式数据库

"揭秘HBase MapReduce高效数据处理秘诀：四步实战攻略，让你轻松玩转大数据分析！"

【8月更文挑战第17天】大数据时代，HBase以高性能、可扩展性成为关键的数据存储解决方案。结合MapReduce分布式计算框架，能高效处理HBase中的大规模数据。本文通过实例展示如何配置HBase集群、编写Map和Reduce函数，以及运行MapReduce作业来计算HBase某列的平均值。此过程不仅限于简单的统计分析，还可扩展至更复杂的数据处理任务，为企业提供强有力的大数据技术支持。

土木林森

498 1 1

听风de歌

|

分布式计算 Hadoop

hadoop格式化HDFS的命令

【7月更文挑战第21天】

听风de歌

1572 5 5

听风de歌

|

分布式计算资源调度 Hadoop

Hadoop执行格式化命令

【7月更文挑战第20天】

听风de歌

606 1 1

花开富贵111

|

机器学习/深度学习分布式计算 DataWorks

MaxCompute产品使用问题之有什么命令可以看到当前账号拥有哪些项目的什么权限

MaxCompute作为一款全面的大数据处理平台，广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践，可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集，涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

花开富贵111

253 5 5

华章出版社

热门文章

最新文章

Hadoop学习笔记（HDP）-Part.11 安装Kerberos

Hadoop五分钟入门指南

Linux系统下pid与pid文件及Hadoop更改pid文件存储位置

hadoop集群常见问题解决

Hadoop深入学习：Combiner

HBase Shell-org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 已解决

Hadoop入门之WordCount运行详解

hadoop伪分布式2.4.1安装

大数据hadoop常见端口

Docker 上部署一主两从Hadoop集群 | [Centos7]（上）

你以为大数据只是存？其实真正的“宝藏”藏在这招里——数据挖掘！

革新智能驾驶数据挖掘检索效率！某国内新能源汽车未来出行领导者选择阿里云Milvus构建多模态检索引擎

数据挖掘：从数据堆里“淘金”，你的数据价值被挖掘了吗？

R语言数据挖掘：从“挖井”到“淘金”

从算法菜鸟到挖掘达人：数据挖掘的算法大冒险

从数据海洋中“淘金”——数据挖掘的魔法与实践

从数据中挖掘洞见：初探数据挖掘的艺术与科学

公司监控上网记录：Scikit-learn 实现公司上网记录数据挖掘

数据挖掘/深度学习-高校实训解决方案

分享一些利用商品详情数据挖掘潜在需求的成功案例

相关课程

更多

大数据知识图谱系列—基于ELK+Flink日志全观测最佳实践

基于Flink的实时大数据应用Demo

大数据Impala教程

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

大数据Spark2020版（知识精讲与实战演练）第三阶段

大数据Spark2020版（知识精讲与实战演练）第四阶段

相关电子书

更多

MaxCompute Serverless 架构演进

Data+AI时代大数据平台应该如何建设

大数据AI一体化的解读

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！