带你读《企业级云原生白皮书项目实战》——5.2.4 SQL开发参考

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 带你读《企业级云原生白皮书项目实战》——5.2.4 SQL开发参考

5.2.4 SQL开发参考

MaxCompute1SQL适用于海量数据(GB、TB、EB级别)离线批量计算的场景。提交MaxCompute作业后,会存在几十秒到数分钟不等的排队调度,所以适合处理批作业,提交一次作业批量处理海量数据。不适合直接对接需要每秒处理几千至数万笔事务的前台业务系统。

5.2.4.1 语法部分

image.png

语法上,如上图,它的语法是标准语法ANSI SQL92的一个子集,并有自己的扩展。如果是从Hive等开源数仓迁移至MaxCompute,或是长期习惯于关系型数据库SQL(MySQL、Oracle、SQL Server)语法的,建议在设计、迁移或开发阶段,仔细比对SQL语法的差异,与其他SQL语法的差异。

整体上,MaxCompute SQL更接近于同为离线数仓的Apache Hive语法,但不完全一致,例如:MaxCompute SQL在DDL上,不支持CREATE TABLE—NOT NULL,而Hive是支持的。

5.2.4.2 SQL限制项

除了SQL代码的语法差异之外,在迁移过程中,SQL限制也是不可忽略的一个检查项,可参考该链接:SQL使用限制项 ,并和原数据库(仓库)的SQL开发规范进行逐项比对,处理好平台适配工作。

5.2.4.3 数据类型

已在5.2.1.2.3章节详细说明,不再重复。

5.2.4.4 查询加速MCQA(MaxCompute Query Acceleration)

从本章节的引言部分可以了解到,MaxCompute SQL我们一般认为是分钟级别的查询效率。MaxCompute的MCQA功能可以对中、小数据量查询作业进行加速优化,将执行时间为分钟级的查询作业缩减至秒级,同时完全兼容原MaxCompute的查询功能,使用原生的MaxCompute SQL语言,并且支持所有的MaxCompute内建函数以及权限系统。

MCQA支持将主流BI工具或SQL客户端连接至MaxCompute项目,开展即席查询(Ad Hoc)或商业智能(BI)分析。

1684997468301.png


5.2.4.4.2 使用限制

此处列举主要的限制项,供使用和选型参考:

•不支持开发者版的MaxCompute(按量计费标准版、包年包月标准版、包年包月套餐版均可以使用)

•单个MaxCompute项目的MCQA作业最大并发数为120

•单次执行的作业支持并发的Worker数上限为2000个

•不支持查询外表

5.2.4.4.3 开通使用

包年包月项目(免费体验)

截止该文档编辑时,针对包年包月的MaxCompute项目,仍提供免费体验额度。该查询加速资源不占用已购买的包年包月计算资源(CU),由查询加速公共资源池提供。具体的限制项如下:

•单个MaxCompute项目,支持的最大作业并发数为5

•单个MaxCompute项目,日免费加速作业数累计为500个

•SQL扫描量在10 GB以内的作业

包年包月项目(交互式配额)

如果您是包年包月项目,并且有更高的负载、更大的作业量需求,目前对于有此类需求的客户,产品提供特殊类型的配额组——交互式配额组,单独用于MCQA查询加速作业使用,处于邀测阶段,提交工单后由研发侧核实region支持情况。如已开启,则在CU管家中新建类型为“交互式”的配额组即可使用,该配额组的CU仅用于MCQA类型加速作业使用。

按量付费项目(非开发者版)

默认MCQA为开通状态,MCQA作业使用单独的计算资源,所以相应地会单独采用自己的按量付费规则,公式为:一次MCQA作业费用=输入数据量×SQL复杂度×单价,按天维度进行汇总出账。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
打赏
0
0
0
0
69
分享
相关文章
OSS大数据分析集成:MaxCompute直读OSS外部表优化查询性能(减少数据迁移的ETL成本)
MaxCompute直读OSS外部表优化方案,解决传统ETL架构中数据同步延迟高、传输成本大、维护复杂等问题。通过存储格式优化(ORC/Parquet)、分区剪枝、谓词下推与元数据缓存等技术,显著提升查询性能并降低成本。结合冷热数据分层与并发控制策略,实现高效数据分析。
构建AI时代的大数据基础设施-MaxCompute多模态数据处理最佳实践
本文介绍了大数据与AI一体化架构的演进及其实现方法,重点探讨了Data+AI开发全生命周期的关键步骤。文章分析了大模型开发中的典型挑战,如数据管理混乱、开发效率低下和运维管理困难,并提出了解决方案。同时,详细描述了MaxCompute在构建AI时代数据基础设施中的作用,包括其强大的计算能力、调度能力和易用性特点。此外,还展示了MaxCompute在多模态数据处理中的应用实践以及具体客户案例,最后提供了体验MaxFrame解决方案的方式。
212 2
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL 数据库 SQL 语句调优方法详解(2-1)
本文深入介绍 MySQL 数据库 SQL 语句调优方法。涵盖分析查询执行计划,如使用 EXPLAIN 命令及理解关键指标;优化查询语句结构,包括避免子查询、减少函数使用、合理用索引列及避免 “OR”。还介绍了索引类型知识,如 B 树索引、哈希索引等。结合与 MySQL 数据库课程设计相关文章,强调 SQL 语句调优重要性。为提升数据库性能提供实用方法,适合数据库管理员和开发人员。
大数据新视界--大数据大厂之MySQL 数据库课程设计:MySQL 数据库 SQL 语句调优的进阶策略与实际案例(2-2)
本文延续前篇,深入探讨 MySQL 数据库 SQL 语句调优进阶策略。包括优化索引使用,介绍多种索引类型及避免索引失效等;调整数据库参数,如缓冲池、连接数和日志参数;还有分区表、垂直拆分等其他优化方法。通过实际案例分析展示调优效果。回顾与数据库课程设计相关文章,强调全面认识 MySQL 数据库重要性。为读者提供综合调优指导,确保数据库高效运行。
玩转大数据:从零开始掌握SQL查询基础
玩转大数据:从零开始掌握SQL查询基础
212 35
云原生应用实战:基于阿里云Serverless的API服务开发与部署
随着云计算的发展,Serverless架构日益流行。阿里云函数计算(Function Compute)作为Serverless服务,让开发者无需管理服务器即可运行代码,按需付费,简化开发运维流程。本文从零开始,介绍如何使用阿里云函数计算开发简单的API服务,并探讨其核心优势与最佳实践。通过Python示例,演示创建、部署及优化API的过程,涵盖环境准备、代码实现、性能优化和安全管理等内容,帮助读者快速上手Serverless开发。
云原生数据仓库AnalyticDB PostgreSQL同一个SQL可以实现向量索引、全文索引GIN、普通索引BTREE混合查询,简化业务实现逻辑、提升查询性能
本文档介绍了如何在AnalyticDB for PostgreSQL中创建表、向量索引及混合检索的实现步骤。主要内容包括:创建`articles`表并设置向量存储格式,创建ANN向量索引,为表增加`username`和`time`列,建立BTREE索引和GIN全文检索索引,并展示了查询结果。参考文档提供了详细的SQL语句和配置说明。
134 2
课时6:阿里云MaxCompute:轻松玩转大数据
阿里云MaxCompute是全新的大数据计算服务,提供快速、完全托管的PB级数据仓库解决方案。它拥有高效的压缩存储技术、强大的计算能力和丰富的用户接口,支持SQL查询、机器学习等高级分析。MaxCompute兼容多种计算模型,开箱即用,具备金融级安全性和灵活的数据授权功能,帮助企业节省成本并提升效率。
158 0
DataWorks产品评测:大数据开发治理的深度体验
DataWorks产品评测:大数据开发治理的深度体验
290 1
MongoDB云原生化:为企业开发注入高效动力
MongoDB云原生化为企业开发注入高效动力,分为三部分:1. 介绍阿里云和MongoDB的服务;2. 阿里云MongoDB解决自建模型痛点的功能,包括隔离性、海量数据处理、弹性能力及运维操作优化;3. 客户案例展示。通过云原生架构,MongoDB实现了灵活的扩展、高效的备份恢复和快速的回档能力,显著提升了企业的业务迭代速度和数据管理效率。典型客户如吉比特、莉莉丝、掌阅等受益于这些功能,实现了更稳定和高效的数据库服务。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问