【小小思考】Redis实现去重任务队列

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 【2月更文挑战第1天】思考一下如何用Redis实现去重的任务队列,主要有List 、List + Set/Hash/Bloom Filter、ZSet、Lua和开源库等方式。

前情提要:一点小小的不完善的方案的思考和设计,不对的地方或是更好的方案欢迎大佬们在评论区讨论~

需求背景:

在Redis里使用List数据结构做任务队列,但是有的时候任务可能会重复添加,所以需要进行去重。
队列需要有优先级,尽量减少Redis操作次数。

尝试方案

目前能够想到的方案有以下几种:

1. List 不重复添加

只使用List,将新的任务加入任务队列之前先判断该任务是否已经存在。
添加任务: 在加入任务队列之前获取List的全部元素,如果新的任务在任务队列里已经存在了,就直接返回;否则的话,将新的任务添加到List里。
获取名字为task_queue的全部元素

LRANGE task_queue 0 -1

将元素插入队尾

LPUSH task_queue val1

执行任务: 从队首取任务。

弹出队首元素

LPOP task_queue

2.List 重复添加

只使用List,但是在出队的时候删除相同的元素。
添加任务: 往List里放数据
将元素插入队尾

LPUSH task_queue val1

执行任务: 从队首取数据,并且取任务的时候将相同的元素删除。
弹出队首元素

LPOP task_queue

移除队列里和val1值相等的元素 LREM说明

 LREM task_queue 0 val1

3. List + Set/Hash/Bloom Filter

Set/Hash/Bloom Filter 的作用都是哈希表,里面存储任务的唯一标识,确保任务不会重复,下面以Set为例。因为从功能性而言,List里存放的是任务的基础信息,除了唯一标识外还有其他额外的业务信息,Set里只用来确保任务不会重复,无需存储额外信息。当然也可以List里只存储任务的唯一标识,Hash里存放额外的业务信息。至于布隆过滤器,一般用于数据量很大的场景,这里的设计都是基于100以内的小排队模式。
添加任务: 先判断该任务在Set里是否存在,如果存在的话,就直接返回;否则,将该任务添加到List和Set里。
判断某个元素val1是否在集合task_set里存在

SISMEMBER task_set val1

将元素插入队尾

LPUSH task_queue val1

向Set添加一个元素

SADD task_set val1

执行任务: 先从List里取数据,判断其在Set里是否存在,如果不存在的话,说明是非法情况,可以给予报警或其他逻辑处理;存在的话,将该元素从Set里删除。
判断某个元素val1是否在集合task_set里存在

SISMEMBER task_set val1

弹出队首元素

LPOP task_queue

4. sorted set (ZSet)

将任务表示作为成员,分数是任务执行时间或是优先级或是其他规则作为分数,这样可以对任务进行排序。
添加任务:
先判断在ZSet里是否存在,如果存在的话跳过或执行业务代码;不存在的话将其添加到ZSet里。
判断某个元素是否存在,ZSet没有直接的api,需要借助其他方式来判断,比如通过返回有序集中元素的分数值可以判断

ZSCORE task_zset val1

添加元素到ZSet里

ZADD key task_zset val1

执行任务:
按排序规则取任务
取分数最大的元素 ZRANGE说明

ZRANGE task_zset 0 0 WITHSCORES

移除分数最大的元素 ZREMRANGEBYRANK 说明

ZREMRANGEBYRANK task_zset 0 0

5. Lua脚本

使用Lua脚本实现原子性操作。可以在添加新任务时执行 Lua 脚本,该脚本会检查任务是否已存在、更新状态等。使用 Lua 脚本的好处是可以减少网络往返次数和提高执行效率。

6. 开源库或框架

Celery:是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的异步任务队列,同时也支持任务调度。
源码
介绍

RQ(Redis Queue)
源码
介绍

问题思考

以上方案存在的问题在于,如果一个任务执行的时间较长,取任务的时候就已经将其从任务队列里删除了,但是当重复任务到达的时候,上一个任务其实并没有执行完,此时任务队列里也没有这个任务,还是会被添加到队列里。
目前能够想到的解决方案,第一个是双List,一个List里存放待执行的任务,一个List里存放正在执行的任务,添加任务的时候同时检查这两个List是否有任务。第二个是List+Set方案里,修改Set里数据表示的含义,待执行和正在执行的任务都存在Set里,也就是执行任务的时候,先从List队首取元素,执行任务,然后再将Set中的元素删除。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
8月前
|
消息中间件 NoSQL Java
别再用 Redis List 实现消息队列了,Stream 专为队列而生
别再用 Redis List 实现消息队列了,Stream 专为队列而生
154 0
|
5月前
|
编解码 NoSQL Java
使用Spring Boot + Redis 队列实现视频文件上传及FFmpeg转码的技术分享
【8月更文挑战第30天】在当前的互联网应用中,视频内容的处理与分发已成为不可或缺的一部分。对于视频平台而言,高效、稳定地处理用户上传的视频文件,并对其进行转码以适应不同设备的播放需求,是提升用户体验的关键。本文将围绕使用Spring Boot结合Redis队列技术来实现视频文件上传及FFmpeg转码的过程,分享一系列技术干货。
272 3
|
2月前
|
设计模式 NoSQL Go
Redis 实现高效任务队列:异步队列与延迟队列详解
本文介绍了如何使用 Redis 实现异步队列和延迟队列。通过 Go 语言的 `github.com/go-redis/redis` 客户端,详细讲解了 Redis 客户端的初始化、异步队列的实现和测试、以及延迟队列的实现和测试。文章从基础连接开始,逐步构建了完整的队列系统,帮助读者更好地理解和应用这些概念,提升系统的响应速度和性能。
59 6
|
3月前
|
NoSQL Java API
美团面试:Redis锁如何续期?Redis锁超时,任务没完怎么办?
在40岁老架构师尼恩的读者交流群中,近期有小伙伴在面试一线互联网企业时遇到了关于Redis分布式锁过期及自动续期的问题。尼恩对此进行了系统化的梳理,介绍了两种核心解决方案:一是通过增加版本号实现乐观锁,二是利用watch dog自动续期机制。后者通过后台线程定期检查锁的状态并在必要时延长锁的过期时间,确保锁不会因超时而意外释放。尼恩还分享了详细的代码实现和原理分析,帮助读者深入理解并掌握这些技术点,以便在面试中自信应对相关问题。更多技术细节和面试准备资料可在尼恩的技术文章和《尼恩Java面试宝典》中获取。
美团面试:Redis锁如何续期?Redis锁超时,任务没完怎么办?
|
8月前
|
存储 监控 负载均衡
保证Redis的高可用性是一个涉及多个层面的任务,主要包括数据持久化、复制与故障转移、集群化部署等方面
【5月更文挑战第15天】保证Redis高可用性涉及数据持久化、复制与故障转移、集群化及优化策略。RDB和AOF是数据持久化方法,哨兵模式确保故障自动恢复。Redis Cluster实现分布式部署,提高负载均衡和容错性。其他措施包括身份认证、多线程、数据压缩和监控报警,以增强安全性和稳定性。通过综合配置与监控,可确保Redis服务的高效、可靠运行。
244 2
|
3月前
|
消息中间件 存储 NoSQL
如何用Redis实现延迟队列?
综上所述,通过Redis的有序集合和一些基本命令,我们可以轻松地构建出功能完善的延迟队列系统。根据具体需求,可以进一步优化和扩展,以满足高性能和高可靠性的业务需求。
77 1
|
4月前
|
消息中间件 NoSQL Go
PHP转Go系列 | ThinkPHP与Gin框架之Redis延时消息队列技术实践
【9月更文挑战第7天】在从 PHP 的 ThinkPHP 框架迁移到 Go 的 Gin 框架时,涉及 Redis 延时消息队列的技术实践主要包括:理解延时消息队列概念,其能在特定时间处理消息,适用于定时任务等场景;在 ThinkPHP 中使用 Redis 实现延时队列;在 Gin 中结合 Go 的 Redis 客户端库实现类似功能;Go 具有更高性能和简洁性,适合处理大量消息。迁移过程中需考虑业务需求及系统稳定性。
|
6月前
|
NoSQL Redis
Redis 使用 hyperLogLog 实现请求ip去重的浏览量
Redis 使用 hyperLogLog 实现请求ip去重的浏览量
48 0
|
8月前
|
缓存 NoSQL Java
面试官:Redis如何实现延迟任务?
延迟任务是计划任务,用于在未来特定时间执行。常见应用场景包括定时通知、异步处理、缓存管理、计划任务、订单处理、重试机制、提醒和数据采集。Redis虽无内置延迟任务功能,但可通过过期键通知、ZSet或Redisson实现。然而,这种方法精度有限,稳定性较差,适合轻量级需求。Redisson的RDelayedQueue提供更简单的延迟队列实现。
472 9
|
8月前
|
存储 缓存 NoSQL
Redis实现延迟任务的几种方案
Redis实现延迟任务的几种方案
下一篇
开通oss服务