滑动窗口限流

简介: 滑动窗口限流

1、需求

限定用户的某个行为在指定时间T内,只允许发生N次。假设T为1秒钟,N为1000次。

2、常见的错误设计

程序员设计了一个在每分钟内只允许访问1000次的限流方案,如下图01:00s-02:00s之间只允许访问1000次,这种设计最大的问题在于,请求可能在01:59s-02:00s之间被请求1000次,02:00s-02:01s之间被请求了1000次,这种情况下01:59s-02:01s间隔0.02s之间被请求2000次,很显然这种设计是错误的。

3、滑动窗口算法

3.1 解决方案

指定时间T内,只允许发生N次。我们可以将这个指定时间T,看成一个滑动时间窗口(定宽)。我们采用Redis的zset基本数据类型的score来圈出这个滑动时间窗口。在实际操作zset的过程中,我们只需要保留在这个滑动时间窗口以内的数据,其他的数据不处理即可。

  • 每个用户的行为采用一个zset存储,score为毫秒时间戳,value也使用毫秒时间戳(比UUID更加节省内存)
  • 只保留滑动窗口时间内的行为记录,如果zset为空,则移除zset,不再占用内存(节省内存)

3.2 pipeline代码实现

代码的实现的逻辑是统计滑动窗口内zset中的行为数量,并且与阈值maxCount直接进行比较就可以判断当前行为是否被允许。这里涉及多个redis操作,因此使用pipeline可以大大提升效率

package com.lizba.redis.limit;


import redis.clients.jedis.Jedis;

import redis.clients.jedis.Pipeline;

import redis.clients.jedis.Response;


/**

* <p>

*     通过zset实现滑动窗口算法限流

* </p>

*

* @Author: Liziba

* @Date: 2021/9/6 18:11

*/

public class SimpleSlidingWindowByZSet {


   private Jedis jedis;


   public SimpleSlidingWindowByZSet(Jedis jedis) {

       this.jedis = jedis;

   }


   /**

    * 判断行为是否被允许

    *

    * @param userId        用户id

    * @param actionKey     行为key

    * @param period        限流周期

    * @param maxCount      最大请求次数(滑动窗口大小)

    * @return

    */

   public boolean isActionAllowed(String userId, String actionKey, int period, int maxCount) {

       String key = this.key(userId, actionKey);

       long ts = System.currentTimeMillis();

       Pipeline pipe = jedis.pipelined();

       pipe.multi();

       pipe.zadd(key, ts, String.valueOf(ts));

       // 移除滑动窗口之外的数据

       pipe.zremrangeByScore(key, 0, ts - (period * 1000));

       Response<Long> count = pipe.zcard(key);

       // 设置行为的过期时间,如果数据为冷数据,zset将会删除以此节省内存空间

       pipe.expire(key, period);

       pipe.exec();

       pipe.close();

       return count.get() <= maxCount;

   }



   /**

    * 限流key

    *

    * @param userId

    * @param actionKey

    * @return

    */

   public String key(String userId, String actionKey) {

       return String.format("limit:%s:%s", userId, actionKey);

   }


}

测试代码:

package com.lizba.redis.limit;


import redis.clients.jedis.Jedis;


/**

*

* @Author: Liziba

* @Date: 2021/9/6 20:10

*/

public class TestSimpleSlidingWindowByZSet {


   public static void main(String[] args) {

       Jedis jedis = new Jedis("192.168.211.108", 6379);

       SimpleSlidingWindowByZSet slidingWindow = new SimpleSlidingWindowByZSet(jedis);

       for (int i = 1; i <= 15; i++) {

           boolean actionAllowed = slidingWindow.isActionAllowed("liziba", "view", 60, 5);


           System.out.println("第" + i +"次操作" + (actionAllowed ? "成功" : "失败"));

       }


       jedis.close();

   }


}

测试效果:

从测试输出的数据可以看出,起到了限流的效果,从第11次以后的请求操作都是失败的,但是这个和我们允许的5次误差还是比较大的。这个问题的原因是我们测试System.currentTimeMillis()的毫秒可能相同,而且此时value也是System.currentTimeMillis()也相同,会导致zset中元素覆盖!

修改代码测试:

在循环中睡眠1毫秒即可,测试结果符合预期!

TimeUnit.MILLISECONDS.sleep(1);


3.3 lua代码实现

我们在项目中使用原子性的lua脚步来实现限流的使用会更多,因此这里也提供一个基于操作zset的lua版本

package com.lizba.redis.limit;


import com.google.common.collect.ImmutableList;

import redis.clients.jedis.Jedis;

import redis.clients.jedis.Pipeline;

import redis.clients.jedis.Response;


/**

* <p>

*     通过zset实现滑动窗口算法限流

* </p>

*

* @Author: Liziba

* @Date: 2021/9/6 18:11

*/

public class SimpleSlidingWindowByZSet {


   private Jedis jedis;


   public SimpleSlidingWindowByZSet(Jedis jedis) {

       this.jedis = jedis;

   }


   /**

    * lua脚本限流

    *

    * @param userId

    * @param actionKey

    * @param period

    * @param maxCount

    * @return

    */

   public boolean isActionAllowedByLua(String userId, String actionKey, int period, int maxCount) {

       String luaScript = this.buildLuaScript();


       String key = key(userId, actionKey);

       long ts = System.currentTimeMillis();

       System.out.println(ts);

       ImmutableList<String> keys = ImmutableList.of(key);

       ImmutableList<String> args = ImmutableList.of(String.valueOf(ts),String.valueOf((ts - period * 1000)), String.valueOf(period));

       Number count = (Number) jedis.eval(luaScript, keys, args);


       return count != null && count.intValue() <= maxCount;

   }



   /**

    * 限流key

    *

    * @param userId

    * @param actionKey

    * @return

    */

   private String key(String userId, String actionKey) {

       return String.format("limit:%s:%s", userId, actionKey);

   }



   /**

    * 针对某个key使用lua脚本限流

    *

    * @return

    */

   private String buildLuaScript() {

       return "redis.call('ZADD', KEYS[1], tonumber(ARGV[1]), ARGV[1])" +

               "\nlocal c" +

               "\nc = redis.call('ZCARD', KEYS[1])" +

               "\nredis.call('ZREMRANGEBYSCORE', KEYS[1], 0, tonumber(ARGV[2]))" +

               "\nredis.call('EXPIRE', KEYS[1], tonumber(ARGV[3]))" +

               "\nreturn c;";


   }


}

测试代码不变,大家可以自行测试,记得还是要考虑我们测试的时候System.currentTimeMillis()相等的问题,不信你输出System.currentTimeMillis()就知道了!多思考问题,技术其实都在心里!

目录
相关文章
|
NoSQL Java 数据库连接
使用Java实现从数据库查出数据存入Redis,并在查询时先查Redis,如果Redis中没有数据再从数据库中读取
使用Java实现从数据库查出数据存入Redis,并在查询时先查Redis,如果Redis中没有数据再从数据库中读取
1243 1
|
11月前
|
机器学习/深度学习 自然语言处理 算法
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下。
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
|
存储 C++ UED
【实战指南】4步实现C++插件化编程,轻松实现功能定制与扩展
本文介绍了如何通过四步实现C++插件化编程,实现功能定制与扩展。主要内容包括引言、概述、需求分析、设计方案、详细设计、验证和总结。通过动态加载功能模块,实现软件的高度灵活性和可扩展性,支持快速定制和市场变化响应。具体步骤涉及配置文件构建、模块编译、动态库入口实现和主程序加载。验证部分展示了模块加载成功的日志和配置信息。总结中强调了插件化编程的优势及其在多个方面的应用。
1355 170
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
575 8
|
机器学习/深度学习 并行计算 大数据
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧2
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
488 10
|
XML 缓存 算法
SpringBoot2 | SpingBoot FilterRegistrationBean 注册组件 | FilterChain 责任链源码分析(九)
SpringBoot2 | SpingBoot FilterRegistrationBean 注册组件 | FilterChain 责任链源码分析(九)
401 0
|
存储 机器学习/深度学习 缓存
一文弄懂Python字典的使用
Python是一门广泛应用于数据分析、机器学习等领域的语言,而字典作为Python中最常用的数据类型之一,也被广泛使用。本文将详细介绍Python字典的相关知识点,包括字典的基础用法、高级用法、原理、优缺点、性能评估、使用场景、小技巧等等。
362 4
|
存储 监控 物联网
MQTT协议问题之OTA升级包下载如何解决
MQTT协议是一个轻量级的消息传输协议,设计用于物联网(IoT)环境中设备间的通信;本合集将详细阐述MQTT协议的基本原理、特性以及各种实际应用场景,供用户学习和参考。
732 3
|
文字识别 安全 网络安全
印刷文字识别产品使用合集之一般包含什么信息, 会被认为敏感信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
存储 分布式计算 定位技术
高德地图与阿里云MaxCompute:构建智慧出行的数据引擎
通过与阿里云MaxCompute的紧密结合,高德地图成功构建了一个高效、稳定的大数据处理平台,实现了从数据采集到价值输出的全过程自动化。这不仅提升了数据处理效率,还极大地改善了用户体验,为智慧出行的发展奠定了坚实的基础。随着技术的不断进步,未来高德地图还将探索更多创新的应用场景,持续推动地图服务向智能化方向演进。