暂无个人介绍
暂时未有相关通用技术能力~
阿里云技能认证
详细说明> 此文是对 Spark on MR3 资料的翻译 原文链接:https://www.datamonad.com/post/2021-08-18-spark-mr3/ 代码链接:https://github.com/mr3project/spark-mr3 MR3 是一个通用的执行引擎,原生支持 Hadoop 和 Kubernetes。虽然 Hive on MR3 是主要应用,但 MR3 也可以
> 论文链接:http://www.cs.umd.edu/~abadi/papers/abadi-sigmod08.pdf ## 概述 该文发表在 2008 年的 SIGMOD 会议上。从论文标题可以看出,论文主要内容不是陈述一种新的技术、架构,而是偏向议论、验证。其主要目的在于阐述清楚在 OLAP 下为什么列式存储Column-Store优于行式存储Row-Store。 在 OLAP 场景
论文三位作者系统系统解答了列式存储与行式存储的区别,通过实验告诉我们,列式存储是因为其内部架构而具有更好的性能,而不是理所当然的理由——更少的 I/O。不仅仅限于内部架构,查询引擎层的各种优化也同样是列式存储性能提升的关键。