开发者社区> 问答> 正文

带Distinct的Count算子与不带Distinct的Count算子在执行计划上有何区别?

带Distinct的Count算子与不带Distinct的Count算子在执行计划上有何区别?

展开
收起
夹心789 2024-05-29 16:47:08 28 0
1 条回答
写回答
取消 提交回答
  • 带Distinct的Count算子在执行计划中,Map Task输出的中间结果无法预聚合,需要将带有去重字段的明细数据传输到Reduce阶段,因此运行速度较慢。而不带Distinct的Count算子则可以在Map阶段进行预聚合,减少数据传输量,从而提高运行速度。

    2024-05-29 20:28:29
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载