开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

大数据计算MaxCompute sql任务并行度怎么提升?

大数据计算MaxCompute sql任务并行度怎么提升?就那个设置worker个数还是reduce个数的那个命令

展开
收起
真的很搞笑 2024-01-16 13:11:32 103 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在MaxCompute SQL任务中,可以通过设置mapred.reduce.tasks参数来调整并行度。该参数用于指定每个MapReduce作业的Reduce任务个数。

    要提升并行度,可以增加mapred.reduce.tasks的值。具体操作如下:

    1. 打开MaxCompute Studio。
    2. 在SQL编辑器中编写您的SQL查询语句。
    3. 点击工具栏上的"运行"按钮或按下F5键执行查询。
    4. 在执行结果页面的右上角,找到"任务配置"(Task Configuration)部分。
    5. 在"任务配置"部分,找到"Advanced Options"(高级选项)。
    6. 在"高级选项"中,找到mapred.reduce.tasks参数。
    7. mapred.reduce.tasks的值增加到您期望的Reduce任务个数。例如,如果您希望有10个Reduce任务,可以将值设置为10。
    8. 修改完成后,再次执行查询即可生效。

    请注意,适当增加并行度可以提高查询性能,但也会增加资源消耗和成本。因此,请根据您的实际需求和预算进行合理的调整。

    2024-01-16 14:23:32
    赞同 展开评论 打赏
  • 并行度设置 和 并行度的优化 可以参考这篇文档https://help.aliyun.com/zh/maxcompute/use-cases/optimize-sql-statements?spm=a2c4g.11186623.0.i43#section-101-eyk-y4l 3fbb74c842a197e6f207f6c8afb0fb77.png
    ,此回答整理自钉群“MaxCompute开发者社区2群”

    2024-01-16 13:48:03
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载