PostgreSQL 多重含义数组检索与条件过滤 (标签1:属性, 标签n:属性) - 包括UPSERT操作如何修改数组、追加数组元素

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
简介:

标签

PostgreSQL , 多重函数数组 , UDF索引 , 过滤 , 文本处理


背景

PG的数组类型,被广泛应用于 画像系统 , 标签系统。

在一些业务重建中,对数组内容的定义往往包含了多重含义,例如即包含了标签本身,又包含了标签的属性(例如 标签值:权值,时间 等)。

那么如何能高效的进行标签的检索,同时又过滤出符合标签加权值的记录呢?

例子

1、建表

create table tbl(id int, info text[]);  

2、写入测试数据

insert into tbl values (1, array['a:100', 'b:10']);  
  
insert into tbl values (2, array['a:15', 'b:20', 'c:99']);  
  
insert into tbl values (3, array['c:78', 'b:100']);  
  
postgres=# select * from tbl;  
 id |       info         
----+------------------  
  1 | {a:100,b:10}  
  2 | {a:15,b:20,c:99}  
  3 | {c:78,b:100}  
(3 rows)  

3、创建UDF1,提取出要查询的标签值(用到了正则匹配)

create or replace function get_label(text[]) returns text[] as $$  
  select array(select substring(unnest($1), '(.*):'));  
$$ language sql strict immutable;  
  
postgres=# select get_label(info) from tbl;  
 get_label   
-----------  
 {a,b}  
 {a,b,c}  
 {c,b}  
(3 rows)  

4、创建UDF1索引

create index idx_tbl1 on tbl using gin (get_label(info));  
  
postgres=# explain select * from tbl where get_label(info) @> array['a'];  
                              QUERY PLAN                                 
-----------------------------------------------------------------------  
 Bitmap Heap Scan on tbl  (cost=2.40..3.86 rows=1 width=36)  
   Recheck Cond: (get_label(info) @> '{a}'::text[])  
   ->  Bitmap Index Scan on idx_tbl1  (cost=0.00..2.40 rows=1 width=0)  
         Index Cond: (get_label(info) @> '{a}'::text[])  
(4 rows)  

5、创建UDF2,提取指定标签的加权值(用到了正则匹配,数组下标计算,数组按位置取元素等操作)

create or replace function get_weight(text[], text) returns text as $$  
  select substring($1[array_position(get_label($1), $2)], ':(.*)');  
$$ language sql strict immutable;  
  
  
postgres=# select info, get_weight(info, 'a') from tbl;  
       info       | get_weight   
------------------+------------  
 {a:100,b:10}     | 100  
 {a:15,b:20,c:99} | 15  
 {c:78,b:100}     |   
(3 rows)  

6、查询SQL如下

查询包含标签a,同时权值大于20的记录。

postgres=# select * from tbl where get_label(info) @> array['a'] and get_weight(info, 'a')::float8 >20;  
 id |     info       
----+--------------  
  1 | {a:100,b:10}  
(1 row)  
  
postgres=# explain select * from tbl where get_label(info) @> array['a'] and get_weight(info, 'a')::float8 >20;  
                                      QUERY PLAN                                        
--------------------------------------------------------------------------------------  
 Bitmap Heap Scan on tbl  (cost=2.40..4.12 rows=1 width=36)  
   Recheck Cond: (get_label(info) @> '{a}'::text[])  
   Filter: ((get_weight(info, 'a'::text))::double precision > '20'::double precision)  
   ->  Bitmap Index Scan on idx_tbl1  (cost=0.00..2.40 rows=1 width=0)  
         Index Cond: (get_label(info) @> '{a}'::text[])  
(5 rows)  

UDF功能是不是很赞呢?

UPSERT时,如何修改数组、追加数组元素

https://www.postgresql.org/docs/10/static/functions-array.html

1、追加元素

array_append(anyarray, anyelement)  
  
array_cat(anyarray, anyarray)  
  
array_fill(anyelement, int[], [, int[]])  
  
array_prepend(anyelement, anyarray)  

2、修改元素

array_replace(anyarray, anyelement, anyelement)  

3、删除元素

array_remove(anyarray, anyelement)  

用法举例

insert into tbl values (1, ?) on conflict (id) do update set info=func(tbl.info,?);    
create table tbl1(id int primary key, info int[]);  
  
postgres=# insert into tbl1 values (1, array[1,2,3]) on conflict (id) do update set info=array_append(tbl1.info, 100) returning *;   
 id |  info     
----+---------  
  1 | {1,2,3}  
(1 row)  
  
INSERT 0 1  
postgres=# insert into tbl1 values (1, array[1,2,3]) on conflict (id) do update set info=array_append(tbl1.info, 100) returning *;   
 id |    info       
----+-------------  
  1 | {1,2,3,100}  
(1 row)  
  
INSERT 0 1  
postgres=# insert into tbl1 values (1, null) on conflict (id) do update set info=array_append(tbl1.info, 100) returning *;   
 id |      info         
----+-----------------  
  1 | {1,2,3,100,100}  
(1 row)  
  
INSERT 0 1  
相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
8月前
|
SQL 关系型数据库 数据库
实时计算 Flink版操作报错之使用SQL 将 PostgreSQL 的 date 类型字段转换为 TIMESTAMP 类型时遇到报错,该如何处理
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
7月前
|
消息中间件 Java 关系型数据库
实时计算 Flink版操作报错合集之从 PostgreSQL 读取数据并写入 Kafka 时,遇到 "initial slot snapshot too large" 的错误,该怎么办
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
1026 0
|
8月前
|
运维 Cloud Native 关系型数据库
云原生数据仓库产品使用合集之原生数据仓库AnalyticDB PostgreSQL版如果是列存表的话, adb支持通过根据某个字段做upsert吗
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
6月前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之使用连接串模式新增PostgreSQL数据源时遇到了报错"not support data sync channel, error code: 0001",该怎么办
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
6月前
|
SQL 监控 关系型数据库
实时计算 Flink版操作报错合集之在设置监控PostgreSQL数据库时,将wal_level设置为logical,出现一些表更新和删除操作报错,怎么办
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
6月前
|
关系型数据库 MySQL 数据库
实时计算 Flink版操作报错合集之在处理PostgreSQL数据库遇到报错。该如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
8月前
|
SQL JSON 关系型数据库
[UE虚幻引擎插件DTPostgreSQL] PostgreSQL Connector 使用蓝图连接操作 PostgreSQL 数据库说明
本插件主要是支持在UE蓝图中连接和操作PostgreSQL 数据库。
72 2
|
存储 NoSQL 关系型数据库
深入探索地理空间查询:如何优雅地在MySQL、PostgreSQL及Redis中实现精准的地理数据存储与检索技巧
深入探索地理空间查询:如何优雅地在MySQL、PostgreSQL及Redis中实现精准的地理数据存储与检索技巧
2226 0
实战篇之基于二进制思想的用户标签系统(Mysql+SpringBoot3
实战篇之基于二进制思想的用户标签系统(Mysql+SpringBoot3
|
8月前
|
存储 SQL 缓存
实战篇之基于二进制思想的用户标签系统(Mysql+SpringBoot2
实战篇之基于二进制思想的用户标签系统(Mysql+SpringBoot2

相关产品

  • 云原生数据库 PolarDB
  • 云数据库 RDS PostgreSQL 版