开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

MaxCompute里一个udtf运行的很慢,progress总在99%的位置这是什么原因呢?

"想问一下,一个udtf运行的很慢,到R3_2,progress总在99%的位置。这是什么原因呢? https://logview.aliyun.com/logview/?h=http://service.cn.maxcompute.aliyun-inc.com/api&p=Mihuashi_MaxCompute_dev&i=20230606104612410g68qw5tkncg&token=WjFHSUtkc0dDKzloMmtNdGlNVG5jMnQweEQ0PSxPRFBTX09CTzpwNF8yMDU0MjQzODQxNDUyNTYxMDgsMTY4ODY0MDM3Mix7IlN0YXRlbWVudCI6W3siQWN0aW9uIjpbIm9kcHM6UmVhZCJdLCJFZmZlY3QiOiJBbGxvdyIsIlJlc291cmNlIjpbImFjczpvZHBzOio6cHJvamVjdHMvbWlodWFzaGlfbWF4Y29tcHV0ZV9kZXYvaW5zdGFuY2VzLzIwMjMwNjA2MTA0NjEyNDEwZzY4cXc1dGtuY2ciXX1dLCJWZXJzaW9uIjoiMSJ9 那个就试跑了一下,这个udtf,我是with下来这个结果,然后再做一些处理。然后再udtf/udaf,结果with下来,再处理,这样是会比较耗时吗?还是?LATERAL VIEW+filter的方式会比udtf省时吗?我发现每个Reduce Worker的工作量并不是均分的,最后一个比较少,就会快一点,odps.stage.reducer.num; odps.stage.reducer.mem 和odps.sql.reducer.memory 的区别是什么啊"

展开
收起
饭也太好吃了 2023-06-09 14:49:31 157 0
1 条回答
写回答
取消 提交回答
  • "能自己不写udf,就不写,整体看下来也就这个阶段时间相比其他阶段长,看reduce阶段的worker也不多,可以加参数调一下。odps.stage.reducer.num:修改每个Reduce阶段的Worker数量。多一点odps.stage.reducer.mem:设置每个Reduce Worker的内存大小。高一点明细参考:https://help.aliyun.com/document_detail/469143.html?spm=a2c4g.120578.0.i1 5514237b9ebdfa5d237f097bb4d7df8b.png如果可以用MaxCompute的内建函数,可以先用内建函数。内建函数实现不了的可以走udf实现一下,odps.stage.reducer.num:修改每个Reduce阶段的Worker数量。 odps.stage.reducer.mem:设置每个Reduce Worker的内存大小。 说明可以在这个文档里看一下:https://help.aliyun.com/document_detail/469143.html?spm=a2c4g.606063.0.i10

    odps.sql.reducer.memory这个参数是内部的一个参数,对应的就是目前文档上的odps.stage.reducer.mem,@宋瑞雪(宋瑞雪 Kumamon) odps.stage.reducer.num:修改每个Reduce阶段的Worker数量。 odps.stage.reducer.mem:设置每个Reduce Worker的内存大小。 说明可以在这个文档里看一下:https://help.aliyun.com/document_detail/469143.html?spm=a2c4g.606063.0.i10

    odps.sql.reducer.memory这个参数是内部的一个参数,对应的就是目前文档上的odps.stage.reducer.mem,此回答整理自钉群“MaxCompute开发者社区2群(答疑@机器人)”"

    2023-06-09 15:40:17
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 相关电子书

    更多
    Data+AI时代大数据平台应该如何建设 立即下载
    大数据AI一体化的解读 立即下载
    极氪大数据 Serverless 应用实践 立即下载