【小小思考】Redis实现去重任务队列

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 【2月更文挑战第1天】思考一下如何用Redis实现去重的任务队列,主要有List 、List + Set/Hash/Bloom Filter、ZSet、Lua和开源库等方式。

前情提要:一点小小的不完善的方案的思考和设计,不对的地方或是更好的方案欢迎大佬们在评论区讨论~

需求背景:

在Redis里使用List数据结构做任务队列,但是有的时候任务可能会重复添加,所以需要进行去重。
队列需要有优先级,尽量减少Redis操作次数。

尝试方案

目前能够想到的方案有以下几种:

1. List 不重复添加

只使用List,将新的任务加入任务队列之前先判断该任务是否已经存在。
添加任务: 在加入任务队列之前获取List的全部元素,如果新的任务在任务队列里已经存在了,就直接返回;否则的话,将新的任务添加到List里。
获取名字为task_queue的全部元素

LRANGE task_queue 0 -1

将元素插入队尾

LPUSH task_queue val1

执行任务: 从队首取任务。

弹出队首元素

LPOP task_queue

2.List 重复添加

只使用List,但是在出队的时候删除相同的元素。
添加任务: 往List里放数据
将元素插入队尾

LPUSH task_queue val1

执行任务: 从队首取数据,并且取任务的时候将相同的元素删除。
弹出队首元素

LPOP task_queue

移除队列里和val1值相等的元素 LREM说明

 LREM task_queue 0 val1

3. List + Set/Hash/Bloom Filter

Set/Hash/Bloom Filter 的作用都是哈希表,里面存储任务的唯一标识,确保任务不会重复,下面以Set为例。因为从功能性而言,List里存放的是任务的基础信息,除了唯一标识外还有其他额外的业务信息,Set里只用来确保任务不会重复,无需存储额外信息。当然也可以List里只存储任务的唯一标识,Hash里存放额外的业务信息。至于布隆过滤器,一般用于数据量很大的场景,这里的设计都是基于100以内的小排队模式。
添加任务: 先判断该任务在Set里是否存在,如果存在的话,就直接返回;否则,将该任务添加到List和Set里。
判断某个元素val1是否在集合task_set里存在

SISMEMBER task_set val1

将元素插入队尾

LPUSH task_queue val1

向Set添加一个元素

SADD task_set val1

执行任务: 先从List里取数据,判断其在Set里是否存在,如果不存在的话,说明是非法情况,可以给予报警或其他逻辑处理;存在的话,将该元素从Set里删除。
判断某个元素val1是否在集合task_set里存在

SISMEMBER task_set val1

弹出队首元素

LPOP task_queue

4. sorted set (ZSet)

将任务表示作为成员,分数是任务执行时间或是优先级或是其他规则作为分数,这样可以对任务进行排序。
添加任务:
先判断在ZSet里是否存在,如果存在的话跳过或执行业务代码;不存在的话将其添加到ZSet里。
判断某个元素是否存在,ZSet没有直接的api,需要借助其他方式来判断,比如通过返回有序集中元素的分数值可以判断

ZSCORE task_zset val1

添加元素到ZSet里

ZADD key task_zset val1

执行任务:
按排序规则取任务
取分数最大的元素 ZRANGE说明

ZRANGE task_zset 0 0 WITHSCORES

移除分数最大的元素 ZREMRANGEBYRANK 说明

ZREMRANGEBYRANK task_zset 0 0

5. Lua脚本

使用Lua脚本实现原子性操作。可以在添加新任务时执行 Lua 脚本,该脚本会检查任务是否已存在、更新状态等。使用 Lua 脚本的好处是可以减少网络往返次数和提高执行效率。

6. 开源库或框架

Celery:是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。
源码
介绍

RQ(Redis Queue)
源码
介绍

问题思考

以上方案存在的问题在于,如果一个任务执行的时间较长,取任务的时候就已经将其从任务队列里删除了,但是当重复任务到达的时候,上一个任务其实并没有执行完,此时任务队列里也没有这个任务,还是会被添加到队列里。
目前能够想到的解决方案,第一个是双List,一个List里存放待执行的任务,一个List里存放正在执行的任务,添加任务的时候同时检查这两个List是否有任务。第二个是List+Set方案里,修改Set里数据表示的含义,待执行和正在执行的任务都存在Set里,也就是执行任务的时候,先从List队首取元素,执行任务,然后再将Set中的元素删除。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
4月前
|
消息中间件 NoSQL Java
别再用 Redis List 实现消息队列了,Stream 专为队列而生
别再用 Redis List 实现消息队列了,Stream 专为队列而生
70 0
|
17天前
|
存储 缓存 NoSQL
Redis实现延迟任务的几种方案
Redis实现延迟任务的几种方案
|
20天前
|
存储 NoSQL Java
Redis 实现延迟任务的深度解析
【4月更文挑战第17天】
125 0
|
25天前
|
监控 NoSQL 测试技术
python使用Flask,Redis和Celery的异步任务
python使用Flask,Redis和Celery的异步任务
|
1月前
|
缓存 NoSQL Java
面试官:Redis如何实现延迟任务?
延迟任务是计划任务,用于在未来特定时间执行。常见应用场景包括定时通知、异步处理、缓存管理、计划任务、订单处理、重试机制、提醒和数据采集。Redis虽无内置延迟任务功能,但可通过过期键通知、ZSet或Redisson实现。然而,这种方法精度有限,稳定性较差,适合轻量级需求。Redisson的RDelayedQueue提供更简单的延迟队列实现。
364 9
|
5月前
|
NoSQL Redis
redis队列
redis队列
30 0
|
7月前
|
消息中间件 NoSQL Java
Redis实现延迟队列,我研究了两种方案,发现并不简单
前段时间有个小项目需要使用延迟任务,谈到延迟任务,我脑子第一时间一闪而过的就是使用消息队列来做,比如RabbitMQ的死信队列又或者RocketMQ的延迟队列,但是奈何这是一个小项目,并没有引入MQ,我也不太想因为一个延迟任务就引入MQ,增加系统复杂度,所以这个方案直接就被pass了。
|
8月前
|
NoSQL 安全 容灾
1分钟实现Redis数据迁移任务
NineData 基于全量复制、增量日志复制技术,提供了高效、安全可靠的 Redis 不停机迁移方案。当然,除了 Redis,NineData 已经支持数十种常见数据库的迁移复制,实现数据库迁移、数据容灾、数据双活、数据仓库实时集成等业务场景。同时,除了 SAAS 模式外,还提供了企业专属集群模式,满足企业最高的数据安全合规要求。
168 0
|
8月前
|
存储 NoSQL 搜索推荐
【Redis从头学-7】Redis中的Set数据类型实战场景之用户画像去重、共同关注、专属粉丝
【Redis从头学-7】Redis中的Set数据类型实战场景之用户画像去重、共同关注、专属粉丝
182 0
|
8月前
|
监控 NoSQL Java
面试官:Redis分布式锁超时了,任务还没执行完怎么办?
今天主要分享的是面试中常见的redis的一些面试内容。如果你正好需要刚好可以帮你回顾一下,如果不需要可以收藏起来后面用到的时候翻出来回顾。