开发者社区问答正文

集群端口配置是什么?

Hadoop HDFS

服务	限定	端口	访问要求	配置	描述
NameNode	-	9000	外部	fs.default.name 或者 fs.defaultFS	fs.default.name已经过期但仍能使用
NameNode	-	50070	外部	dfs.http.address 或者 dfs.namenode.http-address	dfs.http.address已过期但仍能使用

Hadoop YARN (MRv2)

服务	限定	端口	访问要求	配置	描述
JobHistory Server	-	10020	内部	mapreduce.jobhistory.address	-
JobHistory Server	-	19888	外部	mapreduce.jobhistory.webapp.address	-
ResourceManager	-	8025	内部	yarn.resourcemanager.resource-tracker.address	-
ResourceManager	-	8032	内部	yarn.resourcemanager.address	-
ResourceManager	-	8030	内部	yarn.resourcemanager.scheduler.address	-
ResourceManager	-	8088	内部	yarn.resourcemanager.webapp.address	-

Hadoop MapReduce (MRv1)

服务	限定	端口	访问要求	配置	描述
JobTracker	-	8021	外部	mapreduce.jobtracker.address	-

展开

收起

nicenelly 2017-10-30 11:22:48 1534 版权

阿里云 AI 助理回答

您提到的配置信息是关于Hadoop生态系统中几个核心组件的端口配置和访问要求，这些对于管理和运维Hadoop集群至关重要。下面我将基于阿里云的产品知识，为您提供一些补充说明和建议，尤其是如何在阿里云上更好地利用或替代这些服务。

Hadoop HDFS

NameNode (9000/50070端口): NameNode是HDFS的核心，管理文件系统的命名空间和元数据。fs.defaultFS(推荐) 或已过时的 fs.default.name 配置项指定了HDFS的名称节点地址。50070端口用于HTTP访问，查看NameNode的Web UI。在阿里云上，您可以考虑使用阿里云对象存储OSS作为分布式存储的替代方案，它提供了高可用、大规模的数据存储服务，无需直接管理HDFS集群。

Hadoop YARN (MRv2)

JobHistory Server (10020/19888端口): JobHistory Server用于存储和展示MapReduce作业的历史信息。通过调整mapreduce.jobhistory.address和mapreduce.jobhistory.webapp.address可以控制其内部和外部访问。在阿里云上，如果您需要运行批处理任务，可以考虑使用**E-MapReduce (EMR)**服务，它不仅集成了Hadoop、YARN等组件，还提供了更高级的管理和监控功能。
ResourceManager (8025/8032/8030/8088端口): ResourceManager负责集群资源的分配与管理。不同的端口对应ResourceManager的不同服务接口。在阿里云EMR服务中，这些细节通常由平台自动管理，用户更多地关注于作业提交和资源需求配置，而不需要直接配置这些端口。

Hadoop MapReduce (MRv1)

JobTracker (8021端口): 在MapReduce v1中，JobTracker负责作业调度和跟踪。随着YARN（MRv2）的推出，JobTracker已被ResourceManager和ApplicationMaster架构取代。在阿里云环境中，推荐使用支持YARN的EMR服务来提升性能和可扩展性。

阿里云上的实践建议

E-MapReduce (EMR): 阿里云EMR服务为用户提供了一站式的Hadoop、Spark、Hive等大数据处理框架，简化了集群部署、管理及运维工作。通过EMR，您可以快速搭建起一个稳定、安全且高度可扩展的大数据处理环境，同时享受与阿里云其他服务（如OSS、MaxCompute等）的无缝集成优势。
对象存储OSS: 对于存储需求，OSS是一个经济高效的选择，特别适合海量数据的存储和检索，且提供高并发访问能力。
MaxCompute: 如果您的主要需求是进行大规模数据处理和分析，而不只是简单的存储，阿里云MaxCompute（原名ODPS）是一个完全托管的PB级数据仓库解决方案，支持SQL查询、机器学习等多种计算任务，无需关心底层基础设施。

综上所述，虽然了解Hadoop各组件的端口配置是基础，但在阿里云上，通过采用如EMR、OSS、MaxCompute等服务，您可以更加专注于业务逻辑和数据分析，而非底层技术细节的运维。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

分布式计算资源调度 Hadoop

问答标签：

端口配置集群端口集群端口配置

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

集群端口配置是什么?

Hadoop HDFS

Hadoop YARN (MRv2)

Hadoop MapReduce (MRv1)

阿里云上的实践建议

相关文章