1. 含义
类似于Java中的类的概念。包含很多类的属性。
2. 场景
什么样的数据,适合使用struct类型来存储呢?这里列举了几个我在开发中实际用到的场景。
2.1 多个具有相同前缀的字段
其实struct完全可以拆成多个字段。但是对于比较宽的表而言,会有如下特征:
(1)字段数很多,几百个甚至更多;
(2)相近含义的字段,会放到相邻的位置或者使用相同的前缀,以便查找;
对于这种字段,可以考虑放到一个struct里,减少表的字段数,更加方便查找。但是数据字典的维护,依然是比较麻烦的问题。
2.2 对象列表
对象有多种固定的属性,简单的key-value格式无法满足,可以使用array嵌套struct的方式定义。减少了维护数据字典的工作量。
3. 玩转struct
3.1 构造struct
3.1.1 struct
SELECT STRUCT(4,'赵六','男') AS c;
c |
---|
{"col1":4,"col2":"赵六","col3":"男"} |
在没有指定struct内具体字段名的时候,默认为col1、col2、col3、……。所以取值的时候也是这样取,如下:
SELECT STRUCT(4,'赵六','男').col3 AS c;
c |
---|
男 |
3.1.2 named_struct
SELECT NAMED_STRUCT('id',3,'name','王五','gender','男') AS c;
c |
---|
{"id":3,"name":"王五","gender":"男"} |
指定了struct内具体字段名,则named_struct的参数数量必须为偶数,分别是key1、value1、key2、value2、key3、value3、……。所以取值的时候也是这样取,如下:
SELECT NAMED_STRUCT('id',3,'name','王五','gender','男').gender AS c;
c |
---|
男 |
3.2 横纵双向展开struct数组
例如现在有这样一张表:
c |
---|
[{id:1, name:张三, gender:男}, {id:3, name:王五, gender:男}, {id:2, name:李四, gender:男}] |
现在想横向、纵向都展开,成多行多列格式,那么就这样做:
SELECT INLINE(c) FROM `test_table`;
id | name | gender |
---|---|---|
1 | 张三 | 男 |
3 | 王五 | 男 |
2 | 李四 | 男 |
但是这种做法自由度太低,所以很少会使用到。
4. 常见用法
- struct这种类型,更多的是应用在数据存储上。不像array、map还会出现在复杂SQL的中间过程,用于做行列转换等操作。
- struct作为表结构中的字段,可以单独使用,或者是跟array联用,来存储数量不固定的对象数据。在创建表的时候,需要指定好struct内部的字段名、字段类型。
- struct大概是三个复杂类型之中,出场率最低的一个。绝大部分人都只接触过array和map,而几乎没使用过struct。