Redis的三种特殊数据类型Hyperloglog(基数统计)

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: Redis的三种特殊数据类型Hyperloglog(基数统计)

Hyperloglog(基数统计的算法,Redis2.8.9版本就已经更新出来了Hyperloglog 的数据结构,Hyperloglog有着0.81%的错误率,是可以忽略不计的)

学习之前先知道,什么是基数?

比如我有两个数据集 一个为A{1,3,5,7,8,7} 一个为B{1,3,5,7,8}

那么A和B的基数(不重复的元素)为5(1.3,5,7,8),可以接受误差

Hyperloglog的优点

1.占用的内存是固定的(比如说我想放2的64次方不同元素的基数,只需要费12KB的内存),如果要从内存角度来比较的话,Hyperloglog肯定是我们的首选

应用场景:

1 网页的UV(页面访问量,一个人访问一个网站多次,但是还是算作一个人)Hyperloglog有着0.81%的错误率,用作统计UV任务时,是可以忽略不计的(如果允许容错,那么一定可以使用Hyperloglog,如果不允许容错的话可以使用下面的传统set方式或者自己的数据类型即可)

传统的方式,使用set集合的方式保存用户的id等信息(因为set是不允许重复的,然后就可以统计出set中的元素数量作为标准判断),这个方式如果保存大量的用户id,就会比较麻烦(比较占用内存,我们的目的是为了计数,而不是保存用户信息)

Hyperloglog的命令

1 pfadd(name)(v1)(v2)(v3).....创建一组元素并且可以一次性添加多个值
2 pfcount(name)统计一组元素中的基数数量
3 pfmerge (new)(od1) (od2)统计两个老元素中的并集结果集并创建返回给新元素
127.0.0.1:6379[2]> pfadd mykey a b c d e f g h i j #创建第一组元素一次性添加多个值多个值
(integer) 1 #创建成功
127.0.0.1:6379[2]> pfadd mykey2 i j z x c v b n m #创建第二组元素一次性添加多个值多个值
(integer) 1 #创建成功
127.0.0.1:6379[2]> pfcount mykey #统计mykey中基数数量
(integer) 10 #有10个元素
127.0.0.1:6379[2]> pfcount mykey2 #统计mykey2中基数数量
(integer) 9 #有9个元素
127.0.0.1:6379[2]> pfmerge mykey3 mykey mykey2 #合并mykey mykey2把结果集(并集)赋给新元素mykey3
OK
127.0.0.1:6379[2]> pfcount mykey3  #统计mykey3中基数数量
(integer) 15 #有15个元素
127.0.0.1:6379[2]> pfadd k 1 #一次性添加一个值
(integer) 1
127.0.0.1:6379[2]> pfadd k 2 #一次性添加二个值
(integer) 1
127.0.0.1:6379[2]> pfcount k #统计k中基数数量
(integer) 2

3 Bitmap(位图,数据结构,都是操作二进制来进行记录,只有两个状态)

按位存储

Bitmap的使用场景:

1 统计用户信息,活跃,不活跃

2 打卡,两个状态的,都可以使用Bitmap

Bitmap的方法:

场景:使用bitmaps来实现周一到周五的打卡,下表从0开始打卡:1 不打卡:0,判断打卡天数,只需要统计状态为1的即可,例如:周一(0)打卡(1),周二(1)不打卡(0)
1 setbit(name)(sign1) (sign2) 设置元素,一般有两个状态
2 getbit(name)(sign) 根据状态获取某一个值
3 bitcount(name)统计全部的元素个数
1127.0.0.1:6379[2]> setbit sign  0 1 #添加元素例如:周一(0)打卡(1),周二(1)不打卡(0)
(integer) 0
127.0.0.1:6379[2]> setbit sign  1 0 #添加元素例如:周一(0)打卡(1),周二(1)不打卡(0)
(integer) 0
127.0.0.1:6379[2]> setbit sign  2 0 #添加元素例如:周一(0)打卡(1),周二(1)不打卡(0)
(integer) 0
127.0.0.1:6379[2]> setbit sign  3 1 #添加元素例如:周一(0)打卡(1),周二(1)不打卡(0)
(integer) 0
127.0.0.1:6379[2]> setbit sign  4 1 #添加元素例如:周一(0)打卡(1),周二(1)不打卡(0)
(integer) 0
127.0.0.1:6379[2]> getbit sign 0 #查看周一是否打卡
(integer) 1 #打卡
127.0.0.1:6379[2]> getbit sign 1 #查看周二是否打卡
(integer) 0 #没打卡
127.0.0.1:6379[2]>  bitcount sign #查看周一到周五打卡的全部天数
(integer) 3
相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
2天前
|
存储 NoSQL 关系型数据库
【Redis】Redis的特性和应用场景 · 数据类型 · 持久化 · 数据淘汰 · 事务 · 多机部署
【Redis】Redis的特性和应用场景 · 数据类型 · 持久化 · 数据淘汰 · 事务 · 多机部署
14 0
|
2天前
|
NoSQL Redis 数据库
Redis中的常用命令非常丰富,涵盖了各种数据类型的基本操作以及服务器管理和维护的相关指令
【5月更文挑战第15天】Redis常用命令包括通用(如PING、SELECT)、键操作(KEYS、EXISTS、DEL)、字符串(SET、GET)、哈希(HSET、HGET)、列表(LPUSH、LPOP)、集合(SADD、SMEMBERS)和有序集合(ZADD、ZRANGE)等。这些命令用于数据操作及服务器管理,满足不同场景需求。了解更多命令,建议参考Redis官方文档。
11 2
|
2天前
|
SQL NoSQL Java
Redis数据类型 Hash Set Zset Bitmap HyperLogLog GEO
Redis数据类型 Hash Set Zset Bitmap HyperLogLog GEO
17 0
|
2天前
|
存储 NoSQL 定位技术
Redis常用数据类型及常用命令
这些是Redis中常用的数据类型和命令。Redis还提供了许多其他命令和功能,用于数据存储、操作和查询。你可以根据需要选择适当的数据类型和命令来满足你的应用程序需求。
25 4
|
2天前
|
存储 SQL NoSQL
Redis入门到通关之五大基本数据类型及其使用场景
Redis入门到通关之五大基本数据类型及其使用场景
17 0
|
2天前
|
存储 NoSQL Redis
第十八章 Redis查看配置文件和数据类型
第十八章 Redis查看配置文件和数据类型
20 0
|
2天前
|
存储 SQL NoSQL
Redis的数据类型
Redis的数据类型
20 0
|
2天前
|
存储 监控 NoSQL
使用Redis的Bitmap统计一周连续登录的用户
使用Redis的Bitmap统计一周连续登录的用户
13 1
|
2天前
|
负载均衡 监控 NoSQL
Redis的几种主要集群方案
【5月更文挑战第15天】Redis集群方案包括主从复制(基础,读写分离,手动故障恢复)、哨兵模式(自动高可用,自动故障转移)和Redis Cluster(官方分布式解决方案,自动分片、容错和扩展)。此外,还有Codis、Redisson和Twemproxy等工具用于代理分片和负载均衡。选择方案需考虑应用场景、数据量和并发需求,权衡可用性、性能和扩展性。
29 2
|
2天前
|
存储 监控 负载均衡
保证Redis的高可用性是一个涉及多个层面的任务,主要包括数据持久化、复制与故障转移、集群化部署等方面
【5月更文挑战第15天】保证Redis高可用性涉及数据持久化、复制与故障转移、集群化及优化策略。RDB和AOF是数据持久化方法,哨兵模式确保故障自动恢复。Redis Cluster实现分布式部署,提高负载均衡和容错性。其他措施包括身份认证、多线程、数据压缩和监控报警,以增强安全性和稳定性。通过综合配置与监控,可确保Redis服务的高效、可靠运行。
24 2