开发者社区 问答 正文

数据的有序主要用在2个方面,阿里主要讨论尽量减少计算过程中的排序,这里做的主要工作有哪些?

数据的有序主要用在2个方面,基于有序的IO裁剪,另外一个是尽量减少计算过程中的排序,IO裁剪在行列混存以及有较多的讨论,阿里主要讨论第二点,这里做的主要工作有哪些?

展开
收起
罗鹏大佬 2022-04-21 11:10:48 2558 分享
分享
版权
来自: 阿里技术 举报
2 条回答
写回答
取消 提交回答
  • 1、消除多余sorting操作。如果data本身有序,且满足排序要求,则不需要加sort操作。 2、最小化需要排序的列。例如希望对{c1,c2,..cn}排序,如果有谓词c1=5,则order简化成{c2,..cn},避免排序多一个字段。 3、order下推。在初始化阶段,降意向排序操作尽量下推。

    2022-04-21 15:55:35 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • 1

    2022-04-21 13:07:43 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
问答地址: