开发者社区> 问答> 正文

Spark Parquet在列式存储下的统计信息是什么?

Spark Parquet在列式存储下的统计信息是什么?

展开
收起
游客qzzytmszf3zhq 2021-12-09 20:00:44 371 0
1 条回答
写回答
取消 提交回答
  • 插入有统计信息的对应列时才需要进行比较,此处如果是插入姓名列,那就没有比较的必要,只有年龄列会进行此操作,同样对于年龄列进行删除操作后的更新时,只需要针对该列进行遍历即可,这在数据维度很大的情况下可以缩小N(N为数据列数)倍的查询范围;

    2021-12-09 20:00:55
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载