开发者社区> 问答> 正文

同时提交很多hive作业,发现作业一直完成不了

已解决

同时提交很多作业,发现作业一直完成不了

展开
收起
封神 2016-06-07 09:54:34 2950 0
1 条回答
写回答
取消 提交回答
  • 专注在大数据分布式计算、数据库及存储领域,拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验,6年云智能大数据产品技术一号位经验,10年技术团队管理经验;云智能技术架构/云布道师; 研发阿里历代的大数据技术产品包括ODPS、DLA、ADB,最近五年主导宽表引擎研发、DLA、ADB湖仓研发;
    采纳回答

    如果集群规模不是很大,比如几台或者几十台
    1、当提交大量作业时,可能作业的AppMaster占住了所有的资源。那所有的作业都卡住了
    2、当一个较大的作业map跑完成,reduce启动,如果拉取数据超时,则map就会被重跑。如果资源不够,这个作业的appMaster就会释放reduce,释放后可能会被其它的作业占住,导致此作业的map长时间不能运行,reduce又占住了一部分的资源,感觉起来就是卡住了。

    解决问题的办法就是:
    如果卡住,把一些作业kill掉。

    控制提交作业的并发度,分queue保证资源

    2019-07-17 19:29:28
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Comparison of Spark SQL with Hive 立即下载
Hive Bucketing in Apache Spark 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载