开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

在map阶段前先合并小文件,然后增大block,map输出合并,reduce输出合并这些优化参数有吗

在map阶段前先合并小文件,然后增大block,map输出合并,reduce输出合并这些优化参数有吗?

展开
收起
真的很搞笑 2023-03-08 23:03:39 438 0
1 条回答
写回答
取消 提交回答
  • 可以调一调这些参数看看结构,没有办法确定对每个作业都有用,还是需要根据问题作业来断定如何优化的 1. 合并小文件操作:https://help.aliyun.com/document_detail/466838.html 2. 系统按块(Block)存放数据,大小64M无法修改 3. map输出合并:odps.stage.mapper.split.size参数设置的大一些 4. reduce输出合并:odps.stage.reducer.mem参数大一些 https://help.aliyun.com/document_detail/96004.html,此回答整理自钉群“MaxCompute开发者社区1群”

    2023-03-08 23:28:37
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载