开发者社区 问答 正文

集群端口配置是什么?



Hadoop HDFS

服务限定端口访问要求配置描述
NameNode-9000外部fs.default.name 或者 fs.defaultFSfs.default.name已经过期但仍能使用
NameNode-50070外部dfs.http.address 或者 dfs.namenode.http-addressdfs.http.address已过期但仍能使用


Hadoop YARN (MRv2)

服务限定端口访问要求配置描述
JobHistory Server-10020内部mapreduce.jobhistory.address-
JobHistory Server-19888外部mapreduce.jobhistory.webapp.address-
ResourceManager-8025内部yarn.resourcemanager.resource-tracker.address-
ResourceManager-8032内部yarn.resourcemanager.address-
ResourceManager-8030内部yarn.resourcemanager.scheduler.address-
ResourceManager-8088内部yarn.resourcemanager.webapp.address-


Hadoop MapReduce (MRv1)

服务限定端口访问要求配置描述
JobTracker-8021外部mapreduce.jobtracker.address-

展开
收起
nicenelly 2017-10-30 10:52:57 1993 分享 版权
阿里云 AI 助理回答

您提到的配置信息是关于Hadoop生态系统中几个核心组件的网络端口和配置属性的描述,这些对于正确配置和管理Hadoop集群至关重要。下面是对您列出的各个服务及其端口配置的简要解析,以及它们在阿里云环境中的关联性和可能的应用场景。

Hadoop HDFS

  • NameNode (9000): 这是HDFS的主节点,负责管理文件系统的命名空间和存储块映射。fs.default.namefs.defaultFS 配置项指定了客户端访问HDFS的URI,默认端口为9000。尽管fs.default.name已被标记为过时,但在某些旧版本或配置中仍可使用。
  • NameNode Web UI (50070): 提供了一个Web界面来查看HDFS的状态信息。通过dfs.http.addressdfs.namenode.http-address 配置,通常监听在50070端口上。同样地,虽然dfs.http.address已过时,但它可能仍然有效。

Hadoop YARN (MRv2)

  • JobHistory Server (10020 & 19888): JobHistory Server用于存储和展示已完成MapReduce作业的历史信息。内部通信使用10020端口,而外部Web界面通过mapreduce.jobhistory.webapp.address配置,默认为19888端口。
  • ResourceManager:
    • Resource Tracker (8025): 负责接收来自NodeManager的心跳并分配任务。
    • Address (8032): 为应用程序提供提交作业和获取资源的接口。
    • Scheduler (8030): 负责调度任务到合适的NodeManager。
    • Web App (8088): 提供ResourceManager的Web界面,用户可以监控集群状态、提交应用等。

Hadoop MapReduce (MRv1)

  • JobTracker (8021): 在MapReduce v1中,JobTracker是中心控制器,负责作业调度和跟踪。mapreduce.jobtracker.address配置了JobTracker的服务地址,通常监听在8021端口。

阿里云上的应用

在阿里云环境中,虽然直接操作这些底层配置的机会较少(因为阿里云提供了更高级别的数据处理服务如MaxCompute、E-MapReduce等),但了解这些基础架构对于深入理解和优化基于Hadoop的解决方案依然重要。例如:

  • 阿里云E-MapReduce (EMR): 是一个运行在阿里云上的Hadoop生态系统的托管服务,它封装了HDFS、YARN、Hive、Spark等组件,用户可以通过控制台或API轻松创建和管理集群,无需直接配置上述低层端口,但理解这些配置有助于进行更细致的集群调优和问题排查。
  • MaxCompute: 对于大规模数据处理需求,阿里云MaxCompute提供了完全托管的分析服务,用户无需关心底层Hadoop配置,只需关注SQL或编程模型即可。

总之,虽然直接调整这些端口配置在阿里云的某些托管服务中不太常见,但对这些基础知识的掌握有助于更好地利用和维护基于Hadoop的大数据平台。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答
问答地址: