一、Bitmaps
对于bitmap,我们取值的时候,需要知道bit的位置,改值的时候,需要知道位置和修改结果。取值和修改的操作变得复杂了一些,但是节省了存储空间,属于时间换空间。其实redis并没有提供bitmap这种数据类型,只是提供了对string类型操作bit的接口
1. Bitmaps基本操作
设置指定key对应偏移量上的bit值,value只能是1或0
setbit key offset value
获取指定key对应偏移量上的bit值
getbit key offset
如果我们在一个比较大的位设置的时候,这是比较耗时的,同时也耗费空间
所以当我们设置的位都很大的时候,我们统一减去一个offset后,再进行setbit
2. Bitmaps扩展操作
电影网站业务场景
- 统计每天某一部电影是否被点播
- 统计每天有多少部电影被点播
- 统计每周/月/年有多少部电影被点播
- 统计年度哪部电影没有被点播
对指定key按位进行交、并、非、异或操作,并将结果保存到destKey中
bitop op dstKey key1 [key2…] # op是位操作符,and or not xor,key1、key2是运算数,dstKey用于存放运算结果
统计指定key中1的数量
bitcount key [start end]
分别查看8月8日和8月9日被看过电影的数量(哪些bit为1)
统计8号和9号有哪些电影被看了(8号和9号被看得bit置为1,用逻辑或即可得到被看的所有电影)
二、HyperLogLog
统计独立UV的方法有如下几种:
原始方案 set:存储每个用户的id(字符串)
改进方案Bitmaps:存储每个用户状态(bit)
全新的基数统计方案:Hyperloglog。应用场景单一,只做基数统计
基数就是数据集去重后元素的个数,HyoerLogLog运用了LogLog的算法,做基数统计
HyperLogLog类型的基本操作
- 添加数据
pfadd key element [element …]
- 统计数据
pfcount key [key …]
- 合并数据
pfmerge destkey sourcekey [sourcekey …]
相关注意事项
- HyperLogLog用于基数统计,不是集合,不保存数据,只记录数量而不是具体数据
- 核心是计数估算算法,最终数值存在一定误差,误差范围大概是0.81%
- 消耗空间极小,每个hyperloglog key占用了12k的内存用于标记基数
- pfadd命令不是一次性使用12k内存,会随着基数的增加内存逐渐增大,12k是上限
- pfmerge命令合并后占用的内存空间为12k(涉及到分桶,默认用最大的空间12K),无论合并之前数据量多少
三、GEO
GEO类型的基本操作
- 添加坐标点
# key:容器名 # longitude latitude:横纵坐标 # member:地点名称 geoadd key longitude latitude member [longitude latitude member]
- 获取坐标点
geopos key member[member …]
- 计算坐标点距离
geodist key member1 member2 [unit]
- 根据坐标求范围内的数据
georadius key longitude latitude radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
- 根据点求范围内的数据
georadiusbymember key member radius m|km|ft|mi [withcoord] [withdist] [withhash] [count count]
- 获取指定点对应的坐标的hash值
geohash key member [member ...]