开发者社区> 问答> 正文

数据的有序主要用在2个方面,阿里主要讨论尽量减少计算过程中的排序,这里做的主要工作有哪些?

数据的有序主要用在2个方面,基于有序的IO裁剪,另外一个是尽量减少计算过程中的排序,IO裁剪在行列混存以及有较多的讨论,阿里主要讨论第二点,这里做的主要工作有哪些?

展开
收起
罗鹏大佬 2022-04-21 11:10:48 2550 0
来自:阿里技术
2 条回答
写回答
取消 提交回答
  • 1、消除多余sorting操作。如果data本身有序,且满足排序要求,则不需要加sort操作。 2、最小化需要排序的列。例如希望对{c1,c2,..cn}排序,如果有谓词c1=5,则order简化成{c2,..cn},避免排序多一个字段。 3、order下推。在初始化阶段,降意向排序操作尽量下推。

    2022-04-21 15:55:35
    赞同 展开评论 打赏
  • 1

    2022-04-21 13:07:43
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
数据带来无限可能 立即下载
数据+算法定义新世界 立即下载
快速变化背景下,组织如何保持过程的稳定性? 立即下载