备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

MaxCompute写入表如何实现排序

已解决

MaxCompute写入表如何实现排序

展开

收起

阿里云服务支持 2022-12-15 13:32:31 461 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

阿里云服务支持

官方回答
MaxCompute提供zorder by语法把排序列数据相近的行排列在一起，提升查询时的过滤性能，在一定程度上降低存储成本。需要注意的是，order by x, y会严格地按照先x后y的顺序对数据进行排序，zorder by x, y会把相近的尽量排列在一起。当SQL查询语句的过滤条件中包含排序列时，order by后的数据仅对包含x的表达式有较好的过滤效果，zorder by后的数据对包含x或同时包含x、y的表达式均有较好的过滤效果，列压缩比例更高。

zorder by的使用限制如下：
1. 目标表为聚簇表时，不支持zorder by子句。
2. zorder by可以与distribute by一起使用，不能与order by、cluster by或sort by一起使用。
zorder by语法请参考插入或覆写数据。
2022-12-15 13:38:23

赞同展开评论
喜欢猪猪

网站：http://ixiancheng.cn/ 微信订阅号：小马哥学JAVA

clustered by | range clustered by (<col_name> [, <col_name>, …]) [sorted by (<col_name> [asc | desc] [, <col_name> [asc | desc] …])] into <number_of_buckets> buckets：可选。用于创建聚簇表时设置表的Shuffle和Sort属性。

sorted by用于指定在Bucket内字段的排序方式。建议sorted by和clustered by一致，以取得较好的性能。此外，当sorted by子句指定之后，MaxCompute将自动生成索引，并且在查询的时候利用索引来加快执行。

2022-12-15 13:45:14

赞同展开评论

问答分类：

分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute表

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

MaxCompute分桶排序无效

90

1

0

MaxCompute数据量非常大情况下取数据使用哪种排序方式

68

0

0

MaxCompute中WM_CONCAT 排序不好使？不管怎么调都是按照字母排序，这个怎么解？

345

1

0

在大数据计算MaxCompute中，怎么解决开窗函数，排序后的不能去重这个问题？

141

2

0

大数据计算MaxCompute的作业运维 CPU使用占比快照的排序功能是下了吗？

102

0

0

大数据计算MaxCompute上有类似于mysql上field上的函数吗，可以实现自定义排序？

158

1

0

MaxCompute中如何使用WM_CONCAT 函数按照某一字段进行排序聚合

358

1

0

MaxCompute中Java SDK使用getPartitions的排序逻辑

96

1

0

大数据计算MaxCompute partition by 找唯一字段，那就不能分组排序了把？

104

1

0

大数据计算MaxCompute作业运维排序报错，如何解决？

96

2

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里云支持与服务

2304

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

相关文章

手把手教你搞定大数据上云：数据迁移的全流程解析

AI战略丨大模型应用元年，让智能真正转变为生产力

主流ChatBi产品推荐，一文看懂分析agent产品选型

有哪些好用的BI产品？国内外BI工具推荐

从“攒一锅再算”到“来一条就干一条”：大数据批处理到流处理的进化之路

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

大数据计算MaxCompute的group by 时合并array , 用什么方法？

在大数据计算MaxCompute中，这要怎么修改字段类型？

MaxCompute中执行SQL报错ODPS-0130071

大数据计算MaxCompute阿里云一个CU对应多少cpu和内存？

大数据计算MaxCompute可以循环遍历数据么？

阿里云和腾讯云服务器哪个好！

dataworks中maxcompute里是否内置比较字符串相似度的函数？

MaxCompute在d2中使用python3调用阿里云的通义千问api接口，报错如下：貌似无法？

展开全部

odps是什么?

MaxCompute执行作业慢的原因排查

优酷背后的大数据秘密

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

阿里云MaxCompute 2019-5月刊

如何有效降低大数据平台安全风险

展开全部

还有其他疑问?