文档备案控制台

开发者社区问答正文

Hadoop参数调优有哪些方法？

Hadoop参数调优有哪些方法？

展开

收起

游客qzzytmszf3zhq 2021-12-08 22:00:51 372 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

我们常见的「Hadoop参数调优」有以下几种：

在hdfs-site.xml文件中配置多目录，最好提前配置好，否则更改目录需要重新启动集群

NameNode有一个工作线程池，用来处理不同DataNode的并发心跳以及客户端并发的元数据操作

dfs.namenode.handler.count=20 * log2(Cluster Size) 比如集群规模为10台时，此参数设置为60

编辑日志存储路径dfs.namenode.edits.dir设置与镜像文件存储路径dfs.namenode.name.dir尽量分开，达到最低写入延迟

服务器节点上YARN可使用的物理内存总量，默认是8192（MB），注意，如果你的节点内存资源不够8GB，则需要调减小这个值，而YARN不会智能的探测节点的物理内存总量

单个任务可申请的最多物理内存量，默认是8192（MB）

2021-12-08 22:01:04

赞同展开评论

问答分类：

分布式计算 Hadoop

问答标签：

hadoop方法

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Spark中ark.hadoop.odps.cupid.eni.enable 参数是啥作用?

931

1

0

Spark中ark.hadoop.odps.cupid.smartnat.enable参数是啥作用?

980

1

0

Spark中ark.hadoop.odps.input.split.size参数是啥作用呢?

1090

1

0

Spark中ark.hadoop.odps.cupid.resources参数是啥作用呢?

794

1

0

Spark中spark.hadoop.odps.cupid.resources参数是啥意思？

921

1

0

hadoop中掉线时限参数设置是什么？

441

1

0

hadoop怎样实现二级排序的方法是什么？

628

1

0

hadoop中数据输入小文件处理方法有哪些？

495

1

0

hadoop中检查并安装lrzsz的操作方法是什么？

520

1

0

hadoop中十分钟后查看机器是否与时间服务器同步的操作步骤和方法是什么？

472

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于credits购买机制

qoderWorkCn什么时候才能接入阿里云-百炼平台的token plan,自家套餐都没接入

程序员群体，大家都在用什么code plan方案？还有用的什么编码智能体？

QoderCN Jetbrains插件存在EDT反模式

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

相关文章

EMR Serverless Spark PB级文本语义去重4倍加速的技术方案解读

数据治理工具哪家好？2026年使用体验测评

活动报名 | Agentic Lakehouse Meetup · 北京站，从开源技术创新到多模态数据智能化

Apache Doris 4.1 全面增强 Iceberg：支持 UPDATE、MERGE INTO 与 Iceberg V3

EMR Serverless Spark AI Function 的双维降本实践

还有其他疑问?