备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

新版本MaxCompute 的SQL支持 UDF 分区裁剪的逻辑是怎样的？

已解决

新版本MaxCompute 的SQL支持 UDF 分区裁剪的逻辑是怎样的？

展开

收起

甜甜的嘻嘻嘻 2022-08-03 14:49:47 942 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小羊桃桃冰

推荐回答

其逻辑是当提交的 SQL 存在 UDF 的时候，会首先将 UDF 单独提取出来执行，将UDF 的执行结果拿到之后再和原来的查询语句进行拼装再提交。这样一来，当存在动态不确定的信息时，首先会解析动态信息，再确定分区范围，从而进行分区裁剪，尽量减低数据扫描所产生的费用。

以上内容摘自《大数据工程师必读手册》电子书，点击https://developer.aliyun.com/topic/download?id=29可下载完整版

2022-08-03 14:56:48

赞同展开评论

问答分类：

SQL 分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

SQL逻辑 maxcompute SQL 云原生大数据计算服务 MaxCompute sql 云原生大数据计算服务 MaxCompute分区云原生大数据计算服务 MaxCompute逻辑

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

flink 1.13版本 sql中如果一直没有数据到来，则窗口不触发计算sql中怎么设置空闲时间呢？

295

2

0

如何修改MaxCompute中项目的数据类型版本

108

1

0

RDS SQL Server升级数据库版本

107

1

0

'MaxCompute Studio(版本 4.2.0)

196

2

0

SREWorks开源版中包含了哪些阿里云计算平台系列“大数据&AI”产品的开源版本？

119

1

0

Flink 1.15 版本如何支持在不丢失状态的情况下升级 SQL 作业？

81

0

0

sql server版本的rds，想要使用always encrypted功能，需要怎么设置吗？

209

1

0

大数据计算MaxCompute是不支持主键吗？还是有版本区别？

162

0

0

MaxCompute的数据库版本有哪些？

170

1

0

大数据计算MaxCompute的odps-spark-datasource版本在哪查看？

102

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

开发者社区官方技术圈

70134

+ 订阅

阿里云开发者社区官方技术圈，用户产品功能发布、用户反馈收集等。

相关文章

五、Hive表类型、分区及数据加载

三、Hive DDL数据库操作

四、Hive DDL表定义、数据类型、SerDe 与分隔符核心

阿里云服务器Arm计算架构解析：主要实例规格、性能特点、适用场景与价格参考

数据质量不用人盯死：聊聊“规则 + 阈值 + 自愈”怎么玩才靠谱？

热门讨论

热门文章

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

Dataworks中MaxCompute表怎么创建唯一索引啊?

请问大数据计算MaxCompute中有没有类似mysql中这样的设置事务级别的变量的方法？

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute 目前不支持其他格式的csv文件吗？

大数据计算MaxCompute我这边想更改字段长度报错了？

大数据计算MaxCompute阿里云一个CU对应多少cpu和内存？

大数据计算MaxCompute的机器学习深度学习上gpu服务器资源怎么使用和配置？

请问MaxCompute和DataWorks有啥区别？

阿里云一个CU对应多少cpu和内存?

展开全部

3天撸完一个团队半年的项目，单客户数据动辄几百万的行业也玩云？

【最全合集】一文看尽 2019杭州云栖大会 MaxCompute 技术分享

标签分类理论

【转载文章】记录一次MySQL两千万数据的大表优化解决过程，提供三种解决方案

从单租户IaaS到多租户PaaS——金融级别大数据平台MaxCompute的多租户隔离实践

SLS：海量日志数据管理利器

ComputeColStats UDF中近似算法的介绍

flume java介绍

专访20年技术老兵云郎：16年峰回路，每一步都是更好的沉淀

《云数据·大计算：海量日志数据分析与应用》Workshop-入口

展开全部

还有其他疑问?