开发者社区 问答 正文

Spark Parquet在行式存储下的统计信息是什么?

Spark Parquet在行式存储下的统计信息是什么?

展开
收起
游客qzzytmszf3zhq 2021-12-09 20:00:17 395 分享 版权
1 条回答
写回答
取消 提交回答
  • 行式存储:插入删除每条数据都需要将年龄与最大最小值进行比较并判断是否需要更新,如果是插入数据,那么更新只需要分别于最大最小进行对比即可,如果是删除数据,那么如果删除的恰恰是最大最小值,就还需要从现有数据中遍历查找最大最小值来,这就需要遍历所有数据;

    2021-12-09 20:00:32
    赞同 展开评论