开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

shuffle的应用情况如何?

已解决

shuffle的应用情况如何?

展开
收起
游客lmkkns5ck6auu 2022-08-10 10:56:55 299 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    在数据密集型作业中,shuffle 阶段的时间和资源使用占比非常高,有其他大数据公司研究显示,在大数据计算平台上 Shuffle 阶段均是在所有作业的资源使用中占比超过 50%. 根据统计在 MaxCompute 生产中 shuffle 占作业运行时间和资源消耗的 30-70%。

    以上内容摘自《“伏羲”神算》电子书,点击https://developer.aliyun.com/topic/download?id=873

    2022-08-10 17:56:11
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载