开发者社区问答正文

集群端口配置是什么?

Hadoop HDFS

服务	限定	端口	访问要求	配置	描述
NameNode	-	9000	外部	fs.default.name 或者 fs.defaultFS	fs.default.name已经过期但仍能使用
NameNode	-	50070	外部	dfs.http.address 或者 dfs.namenode.http-address	dfs.http.address已过期但仍能使用

Hadoop YARN (MRv2)

服务	限定	端口	访问要求	配置	描述
JobHistory Server	-	10020	内部	mapreduce.jobhistory.address	-
JobHistory Server	-	19888	外部	mapreduce.jobhistory.webapp.address	-
ResourceManager	-	8025	内部	yarn.resourcemanager.resource-tracker.address	-
ResourceManager	-	8032	内部	yarn.resourcemanager.address	-
ResourceManager	-	8030	内部	yarn.resourcemanager.scheduler.address	-
ResourceManager	-	8088	内部	yarn.resourcemanager.webapp.address	-

Hadoop MapReduce (MRv1)

服务	限定	端口	访问要求	配置	描述
JobTracker	-	8021	外部	mapreduce.jobtracker.address	-

展开

收起

nicenelly 2017-10-30 10:52:57 2035 版权

阿里云 AI 助理回答

您提到的配置信息是关于Hadoop生态系统中几个核心组件的网络端口和配置属性的描述，这些对于正确配置和管理Hadoop集群至关重要。下面是对您列出的各个服务及其端口配置的简要解析，以及它们在阿里云环境中的关联性和可能的应用场景。

Hadoop HDFS

NameNode (9000): 这是HDFS的主节点，负责管理文件系统的命名空间和存储块映射。fs.default.name 或 fs.defaultFS 配置项指定了客户端访问HDFS的URI，默认端口为9000。尽管fs.default.name已被标记为过时，但在某些旧版本或配置中仍可使用。
NameNode Web UI (50070): 提供了一个Web界面来查看HDFS的状态信息。通过dfs.http.address 或 dfs.namenode.http-address 配置，通常监听在50070端口上。同样地，虽然dfs.http.address已过时，但它可能仍然有效。

Hadoop YARN (MRv2)

JobHistory Server (10020 & 19888): JobHistory Server用于存储和展示已完成MapReduce作业的历史信息。内部通信使用10020端口，而外部Web界面通过mapreduce.jobhistory.webapp.address配置，默认为19888端口。
ResourceManager:
- Resource Tracker (8025): 负责接收来自NodeManager的心跳并分配任务。
- Address (8032): 为应用程序提供提交作业和获取资源的接口。
- Scheduler (8030): 负责调度任务到合适的NodeManager。
- Web App (8088): 提供ResourceManager的Web界面，用户可以监控集群状态、提交应用等。

Hadoop MapReduce (MRv1)

JobTracker (8021): 在MapReduce v1中，JobTracker是中心控制器，负责作业调度和跟踪。mapreduce.jobtracker.address配置了JobTracker的服务地址，通常监听在8021端口。

阿里云上的应用

在阿里云环境中，虽然直接操作这些底层配置的机会较少（因为阿里云提供了更高级别的数据处理服务如MaxCompute、E-MapReduce等），但了解这些基础架构对于深入理解和优化基于Hadoop的解决方案依然重要。例如：

阿里云E-MapReduce (EMR): 是一个运行在阿里云上的Hadoop生态系统的托管服务，它封装了HDFS、YARN、Hive、Spark等组件，用户可以通过控制台或API轻松创建和管理集群，无需直接配置上述低层端口，但理解这些配置有助于进行更细致的集群调优和问题排查。
MaxCompute: 对于大规模数据处理需求，阿里云MaxCompute提供了完全托管的分析服务，用户无需关心底层Hadoop配置，只需关注SQL或编程模型即可。

总之，虽然直接调整这些端口配置在阿里云的某些托管服务中不太常见，但对这些基础知识的掌握有助于更好地利用和维护基于Hadoop的大数据平台。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

分布式计算资源调度 Hadoop

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

集群端口配置是什么?

Hadoop HDFS

Hadoop YARN (MRv2)

Hadoop MapReduce (MRv1)

阿里云上的应用

相关文章