备案控制台

开发者社区问答正文

如何使用HybridDB for PostgreSQL排序键（SortKey）

排序键是什么

排序键（SortKey）是表的一种属性，可以将数据按照排序键顺序存储在磁盘文件中。排序键主要有两大优势：

加速列存优化，收集的min、max元信息很少重叠，过滤性很好；
对于含有order by和group by等需要排序的SQL可以避免再次排序，直接从磁盘中读取出来就是满足条件的有序数据。

创建表时定义排序键Command: CREATE TABLE Description: define a new table Syntax: CREATE [[GLOBAL | LOCAL] {TEMPORARY | TEMP}] TABLE table_name ( [ { column_name data_type [ DEFAULT default_expr ] [column_constraint [ ... ] [ ENCODING ( storage_directive [,...] ) ] ] | table_constraint | LIKE other_table [{INCLUDING | EXCLUDING} {DEFAULTS | CONSTRAINTS}] ...} [, ... ] ] [column_reference_storage_directive [, ] ] ) [ INHERITS ( parent_table [, ... ] ) ] [ WITH ( storage_parameter=value [, ... ] ) [ ON COMMIT {PRESERVE ROWS | DELETE ROWS | DROP} ] [ TABLESPACE tablespace ] [ DISTRIBUTED BY (column, [ ... ] ) | DISTRIBUTED RANDOMLY ] [ SORTKEY (column, [ ... ] )] [ PARTITION BY partition_type (column) [ SUBPARTITION BY partition_type (column) ] [ SUBPARTITION TEMPLATE ( template_spec ) ] [...] ( partition_spec ) | [ SUBPARTITION BY partition_type (column) ] [...] ( partition_spec [ ( subpartition_spec [(...)] ) ] )

样例:

create table test(date text, time text, open float, high float, low float, volume int) with(APPENDONLY=true,ORIENTATION=column) sortkey (volume);

对表进行排序VACUUM SORT ONLY [tablename]

修改排序键

这个命令只改catalog不会对数据立即排序，需要通过VACUUM SORT ONLY命令排序。 ALTER [[GLOBAL | LOCAL] {TEMPORARY | TEMP}] TABLE table_name SET SORTKEY (column, [ ... ] )

样例: alter table test set sortkey (high,low);

注意事项

一旦对表进行了更新（例如Insert、Update、Delete），表的数据将被视为未按排序键排序，查询中不会将直接从磁盘读出的数据视为有序数据。这时需要重新执行VACUUM SORT ONLY命令重新整理表数据

展开

收起

云栖大讲堂 2017-11-01 11:27:59 1860 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

您提到的排序键（SortKey）概念主要应用于数据库系统中，特别是在分布式数据存储和处理领域，比如Amazon Redshift或者早期的Greenplum数据库等。在阿里云的产品体系中，虽然直接对应的概念可能不叫“排序键”，但类似的功能设计思想体现在不同的产品和服务中，尤其是在大数据处理和分析服务里。

阿里云MaxCompute（原ODPS）

在阿里云MaxCompute中，虽然没有直接使用“排序键”这一术语，但其提供了分区表（Partitioned Table）的概念来优化查询性能。通过合理地对大表进行分区，可以显著加速涉及分区列的查询操作，原理类似于利用排序键加速特定类型查询。MaxCompute支持按照时间、地域或其他业务维度对数据进行分区，用户在创建表时定义分区列，并在加载数据时指定分区值。

阿里云AnalyticDB（原ADS）

对于实时分析型数据库AnalyticDB（特别是AnalyticDB for PostgreSQL），虽然标准SQL命令如CREATE TABLE、ALTER TABLE适用，但具体到排序优化，AnalyticDB更多依赖于其内部的列存索引、物化视图以及智能优化器来自动提升查询效率，而不是直接让用户设置排序键。AnalyticDB能够自动分析查询模式并优化存储与执行计划，以达到高性能查询的目的。

表和数据管理

在阿里云的数据管理服务中，虽然没有直接提供修改表排序方式的命令如VACUUM SORT ONLY，但用户可以通过重新组织数据、优化表结构或利用索引来改善查询性能。例如，在MaxCompute中，如果数据分布或查询需求发生变化，可以通过重写数据或调整分区策略来优化。

总结

阿里云的大数据处理和分析服务虽然没有直接沿用“排序键”的概念，但提供了多种机制和工具来实现类似的数据优化目的，包括但不限于分区、索引、物化视图和智能优化策略。用户应根据具体的业务场景和所选服务的特点，选择合适的方法来优化数据存储和查询性能。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

存储 SQL 关系型数据库 PostgreSQL 云原生数据库 PolarDB

问答标签：

PostgreSQL排序云数据库 RDS PostgreSQL 版排序 hybriddb PostgreSQL PostgreSQL hybriddb 云数据库 RDS PostgreSQL 版hybriddb

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Postgresql 排序添加 nulls first 报错

374

3

0

【RDS】RDS MySQL排序分页查询数据顺序错乱，该如何处理？

1380

1

0

HybridDB for MySQL是否支持公网访问？

834

1

0

HybridDB for MySQL 是否提供OpenAPI？

622

1

0

HybridDB for MySQL 中创建的不同用户是否具有不同的权限？

745

1

0

为什么HybridDB for MySQL 数据库刚创建时就有磁盘空间使用？

692

1

0

HybridDB for MySQL 是否支持磁盘压缩？

785

1

0

HybridDB for MySQL 对SQL的支持和限制是怎样的？

695

1

0

HybridDB for MySQL 是否支持广播表？

578

1

0

HybridDB for MySQL 是分布式数据库的架构吗？

718

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

阿里云云企业网CEN是什么？如何使用？

阿里云全球加速GA是什么？怎么使用？

相关文章

阿里云RDS云数据库收费价格：MySQL、SQL Server、PostgreSQL和MariaDB

告别年费，拥抱源码：一次投入，用Uni+Php源码搭建属于你自己终身的圈子小程序/H5/App

移动端弱网优化专题(十五)：字节跳动移动端网络HttpDNS优化实践

Quick BI使用案例01：巧用lod函数和加速引擎解决跨维度占比计算，从3分钟到0.9秒快速查数

全栈管理系统：Node.js + Express + MySQL + React + Antd

还有其他疑问?