在阿里云AnalyticDB MySQL数据库中,要使用JSON Array索引,首先确保你的集群版本是3.1.10.6或以上,因为只有这些版本支持JSON Array索引功能。接着,你需要为指定的JSON列创建JSON Array索引。创建索引后,在执行查询时,可以利用json_contains()函数来检查JSON数组中是否包含特定的值。
例如,以下SQL语句展示了如何判断vj列中是否同时包含CP-018673和CP-018671:
SELECT json_contains(vj, cast('["CP-018673","CP-018671"]' AS json)) FROM json_test;
为了确认查询是否有效利用了JSON Array索引,你可以在查询前加上EXPLAIN关键字,检查执行计划中是否有ScanFilterProject算子。如果没有这个算子,说明查询利用了索引。此回答整理自钉群“云数据仓库ADB-开发者群”
为降低处理半结构化数据的难度,提升查询效率,AnalyticDB for MySQL提供了半结构化数据检索功能,即JSON索引。本文主要介绍如何创建JSON索引和JSON Array索引。
JSON索引介绍
AnalyticDB for MySQL支持创建JSON索引和JSON Array索引。通过为存储在JSON列中的数据创建JSON索引或JSON Array索引,可以避免在查询数据时扫描全表数据或对整个JSON文档进行解析,从而提升数据查询效率。JSON索引主要适用于存储和查询复杂半结构化数据的场景,例如日志信息、配置文件、设备信息等。
注意事项
JSON索引和JSON Array索引的列数据类型必须为JSON。
一个JSON索引或JSON Array索引仅能包含一个JSON列。如需对多个JSON列创建索引,可创建多个JSON索引或JSON Array索引。
创建JSON索引
创建JSON索引时,您还需注意以下内容:
3.1.5.10及以上内核版本的集群,创建表后不会自动创建JSON索引,您需手动创建JSON索引。
3.1.5.10以下内核版本的集群,创建表后会自动为JSON列创建JSON索引。
创建JSON Array索引后,您可以使用JSON_CONTAINS和JSON_OVERLAPS函数检索数据,从而提高查询效率。
CREATE TABLE table_name(
column_name column_type,
{INDEX|KEY} index_name
)
DISTRIBUTED BY HASH(column_name);
如果您有一个名为json_test的表和一个名为vj的JSON列,可以这样创建JSON Array索引:
CREATE TABLE json_test(
id int,
vj json,
INDEX idx_vj_array(vj->'$[*]')
)
DISTRIBUTED BY HASH(id);
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。