SQL优化器原理 - Join重排
这是MaxCompute有关SQL优化器原理的系列文章之一。我们会陆续推出SQL优化器有关优化规则和框架的其他文章。添加钉钉群“关系代数优化技术”(群号11719083)可以获取最新文章发布动态。
本文的目标是解释Join重排这个特性的基础概念和算法,如果想快速了解并在MaxCompute上使用这个特性,请直接跳到“总结”。
支撑EB级规模的大数据平台深度揭秘
陈鹏宇于2010年加入阿里巴巴,在阿里启动大数据战略早期即参与整个大数据业务发展的过程。作为数据平台见证者和建设者,他以独特的视角,对大数据平台的技术演进历程等做了分享,并从用户角度对数加平台上层工具、服务所适用的场景进行了深入阐述。
【最全合集】一文看尽 2019杭州云栖大会 MaxCompute 技术分享
本文汇集2019杭州云栖大会上MaxCompute的主题分享,内容涵盖MaxCompute技术关键进展及展望,超大规模企业级计算引擎,分布式智能调度执行框架,列式存储引擎,MaxCompute生态,大数据平台的安全风控以及混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践等内容,从底层技术到最佳实践,内容广泛而深入,希望能让读者有所收获。
标签分类理论
最近在做DMP,负责设计一套标签管理系统。在对现有标签进行整理的过程中,整理出了这套东西。
0. 标签的定义:标签分类学(Taxonomy)
对于标签(tag),很难列出一个公认的定义,指明这个概念的种差与属概念。所以为了把握这个概念,就需要采取定义另一种办法:分类与枚举。
我们要解决的第一个