ShuffleError:error in shuffle in fetcher解决办法

简介: ShuffleError:error in shuffle in fetcher解决办法

今天在跑一个hive任务的时候,遇到了这个错误,很明显这个错误是在shuffle阶段出现了问题,报错为java.lang.OutOfMemoryError:java heap space


从网上找到了解决办法,这里记录一下:


异常原因:很可能是因为数据倾斜导致的栈溢出。


在shuffle阶段,会将map的output数据给取下来,然后根据设定的参数决定是放进内存中,还是存储到磁盘里面进行操作。而mapreduce.reduce.shuffle.memory.limit.percent这个参数默认值是0.25,代表单个shuffle能够消耗的内存占reduce所有内存的比例。所以将这个参数进行调小操作,那么单个shuffle能够消耗的内存就没办法满足将数据进行处理,就会使用磁盘来慢慢操作。


解决办法:在跑批脚本中加入

set mapreduce.reduce.shuffle.memory.limit.percent=0.10;

原文链接:https://blog.csdn.net/u013084266/article/details/8076404

相关文章
|
前端开发
前端报错 error: unknown option `-v' 解决方法
前端报错 error: unknown option `-v' 解决方法
2188 0
|
前端开发 JavaScript
前端 fetchMetadata: sill fetchPackageMetaData error for detec卡住解决办法
前端 fetchMetadata: sill fetchPackageMetaData error for detec卡住解决办法
2195 0
|
存储 PyTorch 算法框架/工具
Error(s) pytorch 加载checkpoint state_dict出错:Missing key(s) && Unexpected key(s) in state_dict
Error(s) pytorch 加载checkpoint state_dict出错:Missing key(s) && Unexpected key(s) in state_dict
733 0
Error(s) pytorch 加载checkpoint state_dict出错:Missing key(s) && Unexpected key(s) in state_dict
|
4月前
|
并行计算 PyTorch 算法框架/工具
OSError: [WinError 1455] 页面文件太小,无法完成操作如何解决。
如何解决Windows系统中出现的"OSError: [WinError 1455] 页面文件太小,无法完成操作"的错误。文章提供了具体的解决步骤。
106 0
OSError: [WinError 1455] 页面文件太小,无法完成操作如何解决。
|
7月前
|
SQL DataWorks 关系型数据库
DataWorks操作报错合集之执行读取任务时遇到报错:“ERROR: failed to acquire resources on one or more segments”,该怎么解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
8月前
|
TensorFlow 算法框架/工具
【ERROR】FailedPreconditionError: checkpoint is not a directory
【ERROR】FailedPreconditionError: checkpoint is not a directory
118 1
|
8月前
|
缓存
Error: EIO: i/o error, read如何解决
Error: EIO: i/o error, read如何解决
|
9月前
|
API Android开发 开发者
debug常见错误,出现debug时出现跑进为条件为false的if语句,DELETE_FAILED_INTERNAL_ERROR Error while In
debug常见错误,出现debug时出现跑进为条件为false的if语句,DELETE_FAILED_INTERNAL_ERROR Error while In
62 5
|
9月前
|
数据库
Greenplum【异常 03】COPY命令报错 > ERROR: invalid input syntax for type double precision: ““(问题分析及解决方案)数据去重
Greenplum【异常 03】COPY命令报错 > ERROR: invalid input syntax for type double precision: ““(问题分析及解决方案)数据去重
264 0