开发者社区> 问答> 正文

EMR集群如何配置Yarn和Spark组建的日志定期清理策略

已解决

EMR集群如何配置Yarn和Spark组建的日志定期清理策略

展开
收起
提个问题 2024-06-10 15:13:25 6 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答
    一、Yarn相关配置:
    1、yarn-site配置文件:开启日志聚合参数 yarn.log-aggregation-enable 设置为true;
    2、yarn-site配置文件:在删除聚合日志之前保留聚合日志的时间参数 yarn.log-aggregation.retain-seconds 单位为毫秒;
    3、yarn-site配置文件:yarn日志聚合保留检查间隔yarn.log-aggregation.retain-check-interval-seconds 参数 单位为毫秒;
    二、Spark相关配置:
    1、spark-defaults.conf配置文件:spark历史保留作业数目 spark.history.retainedApplications 参数;
    2、spark-defaults.conf配置文件:指定历史记录服务器是否应定期从存储中清除事件日志 spark.history.fs.cleaner.enabled 参数,设置为true;
    3、spark-defaults.conf配置文件:spark日志清理时间间隔 spark.history.fs.cleaner.interval 参数,参考值:1d;
    4、spark-defaults.conf配置文件:spark日志清理最大日期天数 spark.history.fs.cleaner.maxAge 参数,参考值:3d;
    2024-06-10 15:13:26
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
PostgresChina2018_赖思超_PostgreSQL10_hash索引的WAL日志修改版final 立即下载
Kubernetes下日志实时采集、存储与计算实践 立即下载
日志数据采集与分析对接 立即下载