整数集合的概念
当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现,它可以保存的类型为int16_t、int32_t或者int64_t的整数值,集合中不允许有重复元素,Redis除了支持集合内的增删改查,同时还支持多个集合的交并集操作,合理地使用集合可以在实际开发中解决很多实际问题。
常用命令
集合内的操作
添加元素: sadd key element[element ...],返回结果为添加成功的元素个数。
删除元素: srem key element[element ...],返回结果为成功删除的元素个数。
计算元素个数:scard key,该命令的实际复杂度为O(1),不会遍历集合中所有元素,而是直接使用Redis的内部变量。
判断元素是否在集合中:slsmember key element,存在则返回1,否则返回0;
随机从集合中返回指定个数的元素:srandmember key[count];
从集合随机弹出元素:spop key;
获取全部元素: smembers key;
集合间操作
取交集: sinter key [key ...]
取并集 sunion key [key ...]
取差集: sdiff key [key ...]
整数集合的实现
整数集合(intset)是Redis用于保存整数值的集合抽象数据结构,它可以保存类型为int6_t、int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。
typedef struct intset { // 编码方式 uint32_t encoding; // 集合包含的元素数量 uint32_t length; // 保存元素的数组 int8_t contents[]; } intset;
contents 数组时整数集合的底层实现,整数集合的每个元素都是contents数组的一个数组项(item),各个项在数组中按值的大小从小到大的有序排列,并且数组中不包括任何重复项。
length属性记录了整数集合包含的元素数量,也即是contents数组的长度。
虽然intset结构将contents属性声明为int8_t类型的数组,但实际上contents数组并不保存任何int8_t类型的值,contents数组的整数类型取决于encoding属性的值。
如果encoding属性的值INTSET_ENC_INT16,那么contents就是一个int16_t类型的数组,数组里的每个项都是一个int16_t类型的整数值(最少值为 -32768,最大值为 32767)。
如果encoding属性的值为INTSET_ENC_INT32,那么contents就是一个int32_t类型的数组,数组里的每个项都是一个int32_t类型的整数值(最小值为-2147483648,最大值为2147483647)。
如果encoding属性的值为INTSET_ENC_INT64,那么contents就是一个int64_t类型的数组,数组里的每个项都是一个int64_t类型的整数值(最小值为-9223372036854775808,最大值为9223372036854775807)。
举个例子
如上图所示,encoding属性的值为INTSET_ENC_INT16,表示整数集合的底层实现为int16类型的数组,而集合保存的都是int16_t类型的整数值。
length属性的值为5,表示整数集合包含五个元素。
content数组按从小到大的顺序保存着集合中的五个元素。
因为每个集合元素都是int16_t类型的整数值,所以contents数组的大小等于size of(int16_t) *5=80位
整数集合的升级
每当我们要将一个新元素添加到整数集合里面,并且新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要进行升级(upgrade),然后才能将新元素添加到整数集合里面。
升级整数集合并添加新元素共分为三步进行
1.根据新元素的类型,扩展整数集合数组的空间大小,并为新元素分配空间。
2.将底层数组现有的所有元素都转换成新元素相同的类型,并将类型转换后的元素放置在正确的位置上,而且在放置元素的过程中,需要继续维持底层数组的有序性不变。
3.将新元素添加到底层数组里面。
升级的好处
1.提升灵活性
因为整数集合可以通过自动升级底层数组类型适应新元素,所以我们可以随意地将int16_t、int32_t或int64_t类型的整数添加到集合中,而不必担心出现类型错误,这种做法非常灵活。
2.节约内存
要让一个数组可以同时保存int16_t、int32_t、int64_t三种类型的值,最简单的做法就是直接使用int64_t类型的数组作为整数集合的底层实现,不过这样一来,即使添加到整数集合里面的都是int16_t类型或者int32_t类型的值,数组都需要使用int64_t类型的空间去保存他们,从而出现了浪费内存的情况。
使用场景
集合类型典型的使用场景就是标签功能(tag),标签数据对用户体验以及增强用户粘度比较重要。
下面简单介绍如何使用集合类型实现标签功能的若干功能:
1.给用户添加标签
sadd user:1:tags tag1 tag2 tag3 sadd user:2:tags tag1 tag2 tag4 ... sadd user:3:tags tag1 tag2 tag5
2.给标签添加用户
sadd tag1:users user:1 user:2 sadd tag2:users user:1 user:3 ... sadd tag3:users user:1 user:4
3.删除用户下的标签
srem user:1:tags tag1 tag5
4.计算用户共同感兴趣的标签
sinter user:1:tags user:2:tags
总结
本文简单介绍了整数集合这种数据结构,整数集合是集合键的底层实现之一,是专门用来存储整数的,整数集合的底层实现是数组,这个数组以有序,无重复的方式保存集合元素,在有需要时,程序为会根据新添加元素的类型,改变这个数组的类型,升级操作为整数集合带来了操作上的灵活性,并且尽可能节约了内存。