通过Redis学习事件驱动设计

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 通过Redis学习事件驱动设计

 01


为什么我说C程序员都要阅读Redis源码


主要原因就是『简洁』。如果你用源码编译过Redis,你会发现十分轻快,一步到位。其他语言的开发者可能不会了解这种痛,作为C/C++程序员,如果你源码编译安装过Nginx/Grpc/Thrift/Boost等开源产品,你会发现有很多依赖,而依赖也有自己的依赖,十分苦恼。通常半天一天就耗进去了。由衷地羡慕 npm/maven/pip/composer/...这些包管理器。而Redis则给人惊喜,一行make了此残生。


除了安装过程简洁,代码也十分简洁。使用纯C语言编写,每个模块功能都划分的很清晰。


废话不多说,本文要介绍的是Redis里的事件处理功能,与Memcache引入libevent这一臃肿的事件库不同,Redis自己实现了一个小型轻量的事件驱动库——AE。阅读它的源码是一次非常好的学习体验。


 02

干净整齐的跨平台兼容


文件名说明ae.h/ae.c主要文件,根据OS平台的不同依赖以下不同文件:

文件 平台
ae_epoll.c Linux平台
ae_kqueue.c BSD平台
ae_evport.c Solaris平台
ae_select.c 其他Unix平台


虽然源码文件看起来不少,但是实际上ae_epoll.c、 ae_kqueue.c、 ae_evport.c、 ae_select.c 这4个文件的功能是完全一样的,提供一致的API接口,给ae.c文件调用。这是由于实现高性能的事件驱动的API(称之为polling API)不存在ANSI或POSIX的标准,不同的OS内核有着自己的实现。比如Linux内核的epoll,BSD内核中的kqueue。


ae.c中有:

#ifdef HAVE_EVPORT
#include "ae_evport.c"
#else
    #ifdef HAVE_EPOLL
    #include "ae_epoll.c"
    #else
        #ifdef HAVE_KQUEUE
        #include "ae_kqueue.c"
        #else
        #include "ae_select.c"
        #endif
    #endif
#endif



请注意这里include的都是源文件,而非头文件。为什么这样?大家可以自己思考一下。


这些HAVE的宏,都是由在config.h中定义的。依据不同的操作系统,引入这4个文件中的某一个。从功能上来说,这样设计的目的与GOF设计模式中“适配器模式”(修改成一致接口)或“外观模式”(抽象复杂接口为简单接口)的思想类似,但实际上我个人感觉更类似于《POSA》(卷二)中提到的“包装门面模式”(Wrapper Facade)。Anyway,这个编程思想值得学习。


03


aeEventLoop:用C++去设计,用C编码


十几年前,以Linux之父炮轰C++为开端,社区内展开了一场C与C++孰是孰非的论战。而在国内,以原CSDN总编刘江援引此文为始,把战火烧到了国内。孟岩、云风、pongba几位大佬都身陷其中。后来以孟岩的一句『用C设计,用C++编码』在国内为这场论战定下基调。


反观Redis,他是纯C编码,但是融入了面向对象的思想。和上述观点截然相反,可谓是『用C++去设计,用C编码』。当然本文目的并非挑起语言之争,各种语言自有其利弊,开源项目的语言选择也主要是由于项目作者的个人经历和主观意愿。


定义在ae.h中的结构体 aeEventLoop 是AE库中最核心的数据结构,并且它采用了面向对象的设计思想:ae.h 中声明了多个函数,其第一个参数都是一个aeEventLoop指针,用于操纵aeEventLoop结构体。


从这个角度来说,可以将该结构体理解为面向对象语言中的类,而操纵它的函数则可以视为其成员函数。(其实C++的class编译之后大概也是类似的模式)


函数 说明
aeCreateEventLoop

初始化一个事件循环结构体

(eventLoop)

aeGetSetSize 返回当前setsize的值
aeResizeSetSize

改变setsize的值

(重新分配空间)

aeDeleteEventLoop 删除事件循环,释放内存空间
aeStop 停止事件循环,即stop值设为1
aeProcessEvents

ae核心:事件处理逻

aeMain 启动事件循环,事件循环的入口
aeSetBeforeSleepProc

注册回调函数,每次主循环在休眠前被调用


aeCreateEventLoopaeDeleteEventLoop 可以视为“类”aeEventLoop的构造和析构函数,其他为成员函数。


在程序中调用AE库的时候,一般是依次调用:


  1. aeCreateEventLoop
  2. 给EventLoop注册文件事件or时间事件
  3. aeSetBeforeSleepProc
  4. aeMain
  5. aeDeleteEventLoop


3-1


AE的两种事件

事件处理,是有别于多线程/多进程的并发模型。我也都知道Redis是单线程的。它的性能主要依靠异步事件处理功能来实现。虽然事件处理通常和网络编程混作一谈,但其实事件处理本身不一定是为网络编程服务的,它主要是服务于IO,网络通信是IO,文件读写同样是。当然Unix中万物皆文件了,socket也是一种fd。


AE支持两种事件:


  1. 文件事件(IO)
  2. 时间事件(毫秒级)

这两种事件都作为aeEventLoop的结构体成员存在。
aeEventLoop各成员说明:

typedef struct aeEventLoop {
    int maxfd;                      /* 当前注册的最大fd */
    int setsize;                    /* 监视的fd的最大数量 */
    long long timeEventNextId;      /* 下一个时间事件的ID */
    time_t lastTime;                /* 上次时间事件处理时间 */
    aeFileEvent *events;            /* 已注册文件事件数组 */
    aeFiredEvent *fired;            /* 就绪的文件事件数组 */
    aeTimeEvent *timeEventHead;     /* 时间事件链表的头 */
    int stop;                       /* 是否停止(0:否;1:是)*/
    void *apidata;                  /* 各平台polling API所需的特定数据 */
    aeBeforeSleepProc *beforesleep; /* 事件循环休眠开始的处理函数 */
    aeBeforeSleepProc *aftersleep;  /* 事件循环休眠结束的处理函数 */
} aeEventLoop;

文件事件,主要依靠两个数组。一个是注册的文件事件数组,一个是已就绪的文件事件数组。

typedef struct aeFileEvent {
    int mask; /* one of AE_(READABLE|WRITABLE|BARRIER) */
    aeFileProc *rfileProc;
    aeFileProc *wfileProc;
    void *clientData;
} aeFileEvent;

typedef struct aeFiredEvent {
    int fd;
    int mask;
} aeFiredEvent;



单词Fired有通知的意思,在这里你可以理解为“就绪”


每个文件事件,其读写设置了不同的处理函数。另外mask表示事件的触发类型。当每次polling API返回就绪之后(比如epoll_wait返回),就绪会被设置到aeFireEvent,然后反查aeFileEvent获得处理函数并处理。你会发现aeFileEvent结构体里并没有记录fd。其实这是使用了HASH策略,aeEventLoop的成员 aeFileEvent数组的下标即是fd,便于快速查找。


时间事件,本质就是定时器任务,其数据结构采用一个双向链表。链表每个结点为aeTimeEvent结构体,主要包含事件的ID(递增)、就绪的时间,处理函数、清理函数、客户数据。

typedef struct aeTimeEvent {
    long long id; /* time event identifier. */
    long when_sec; /* seconds */
    long when_ms; /* milliseconds */
    aeTimeProc *timeProc;
    aeEventFinalizerProc *finalizerProc;
    void *clientData;
    struct aeTimeEvent *prev;
    struct aeTimeEvent *next;
} aeTimeEvent;


每个事件循环中,每个时间事件的ID唯一且递增,主要依赖aeEventLoop里的timeEventNextId来维护这个ID的递增关系。创建新的时间事件时(aeCreateTimeEvent)会赋值,由于只考虑了单线程,所以没有加锁逻辑,大家也不要贸然把AE用在多线程环境中。


when_sec和 when_ms 记录了时间事件的就绪时间(秒+毫秒),即当当前时间大于等于这个时间的时候,该时间事件应被处理。


时间事件的处理过程(processTimeEvents)主要就是:继续遍历链表,如果发现节点状态为AE_DELETED_EVENT_ID则删除该节点。如果判断当前时间已经超过节点的就绪时间就开始处理。处理函数的返回值可以指定,后续不再处理该事件(NOMORE),则该节点会被置为AE_DELETED_EVENT_ID。如果下次还需要处理,则更新该节点的时间为下次就绪时间。


3-2


事件循环的处理逻辑


再用一张图,回顾一下EventLoop中的两种事件,基本可以做如下理解。一个链表,一个数组。文件事件中的数组不是线性填满的,因为是采用的HASH策略,将fd作为数组下标了。


微信图片_20220528191315.jpg


aeProcessEvents 是aeEventLoop在循环过程中的的实际处理逻辑。函数原型如下:


int aeProcessEvents(aeEventLoop *eventLoop, int flags);

flags标记,表示本次需要处理的事件类型标记和是否阻塞标记。


标记位 含义
AE_TIME_EVENTS 时间事件标记
AE_FILE_EVENTS 文件事件标记
AE_DONT_WAIT 立即返回不阻塞等待的标记


aeProcessEvents 具体实现代码我就不贴了。它巧妙的地方是一次柔和了文件和时间事件的两种处理过程。在函数之初,会查找时间事件的链表,找到最近就绪时间事件,然后用它的就绪时间减去当前时间的时间差作为 polling API 的休眠时间(epoll_wait的timeout参数)。然后休眠等待polling api返回。在返回之后先执行aftersleep的的处理逻辑,然后执行这段休眠时间内就绪的文件事件,最后再处理就绪的时间事件。返回值是处理过的事件总数。


也就说AE会尽量在一次处理过程中,将时间事件和文件事件一次性处理。你也许会问如果没有时间事件怎么办。当然没关系,在aeProcessEvents开始部分就根据标记位进行了判断。上面的逻辑是在文件事件和时间事件都存在的情况下,如果仅存在文件事件,则看是否设置了不阻塞的标记(AE_DONT_WAIT),若有,则polling 的超时时间设置为0。如无,即可以阻塞,则设置为-1,则polling API会阻塞直到有文件事件发生。


04


ae_epoll:Linux上epoll的封装


前文说道Redis适配各种Unix-like的操作系统。它将内核强相关的事件API(polling API)部分单独抽出来,包装出了相同的接口给AE的对外API调用。在Linux系统上的API实现为:ae_epoll.c,建议在阅读这个文件源码之前先好好回顾一下epoll的API,这样更助于快速理解。相信工作后大家写业务逻辑,应该很少接触epoll了。可以阅读这个wik,快速回顾epoll的api:LinuxAPI:epoll


ae_epoll.c 完全被 ae.c调用。各函数调用关系如下(aeApi开头的都是ae_epoll.c中的函数):

ae.c


  • aeCreateEventLoop
  • aeApiCreate
  • aeResizeSetSize
  • aeApiResize
  • aeDeleteEventLoop
  • aeApiFree
  • aeCreateFileEvent
  • aeApiAddEvent
  • aeDeleteFileEvent
  • aeApiDelEvent
  • aeProcessEvent
  • aeApiPoll
  • aeGetApiName
  • aeApiName

除了aeApiName()以外,其他函数第一个参数也都是aeEventLoop * 。用面向对象的思想来看这也是aeEventLoop的成员函数。试想若是C++,则可能会被处理成父子两个类,而aeApi系列的函数是纯虚的。


aeApi的函数也是可以做到顾名即可思义。比如:


  • aeApiCreate在堆上进行内存的分配,封装epoll_create创建epfd,并写入aeEventLoop。
  • aeApiAddEvent、aeApiDelEvent是封装的epoll_ctl来对aeEventLoop的监控的epoll事件进行添加和删除。
  • aeApiPoll是封装的epoll_wait开启事件循环,并且每次取出就绪的fd存入aeEventLoop的fired数组中,并置位相应的mask(读or写)
  • aeApiResize、aeApiFree分别进行的是内存的重分配、资源的清理(关闭epfd,free内存)和epoll本身关联不大。

05


Jim:AE的缘起


阅读完AE代码,可能只需要一下午的时间,你会惊叹于作者的设计功力。其实里面也没有太多花哨的东西,但就是如此简洁清晰的给你呈现了一个完成度如此之高的事件驱动处理库。但我想即使大家都熟悉epoll、熟悉kqueue、熟悉数据结构也不一定能设计出来AE,所以把程序员比作代码的设计师、建筑师是丝毫不为过的。


AE的设计灵感其实也是受另外一个开源项目影响,它就是 Jim。

Redis的ae.c的开篇注释中就已注明:

A simple event-driven programming library. 
Originally I wrote this code for the Jim's event-loop (Jim is a Tcl interpreter)
but later translated it in form of a library for easy reuse.

Redis作者说他最初是为了Jim项目的事件驱动功能编写了一套代码,后来将其改造成了一个易于复用的库。


所以AE其实可以脱离Redis而存在。这种松耦合,是一种设计的魅力。

Jim的源码在Github上有它的镜像,其中事件循环的代码在此:


https://github.com/msteveb/jimtcl/blob/master/jim-eventloop.c


快速阅读一下Jim的代码,AE整体处理逻辑确实与Jim相似。但AE也不乏创新,比如抽象出polling API这层,达到了多平台的兼容和解耦,而Jim则强耦合了select。


我们常说『站在巨人的肩膀』,虽然Jim不是巨人,但作者通过为他编写代码,从而启发了AE,即使Jim最终被世人遗忘,而它的血肉也化作了土壤,滋养后来人,这就是开源运动的意义所在,也是魅力所在。学习的本质,其实就是模仿,然后改进,这不是抄袭,这是传承。


相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
6月前
|
存储 NoSQL Redis
Redis系列学习文章分享---第十六篇(Redis原理1篇--Redis数据结构-动态字符串,insert,Dict,ZipList,QuickList,SkipList,RedisObject)
Redis系列学习文章分享---第十六篇(Redis原理1篇--Redis数据结构-动态字符串,insert,Dict,ZipList,QuickList,SkipList,RedisObject)
85 1
|
2月前
|
NoSQL 数据可视化 Linux
redis学习四、可视化操作工具链接 centos redis,付费Redis Desktop Manager和免费Another Redis DeskTop Manager下载、安装
本文介绍了Redis的两个可视化管理工具:付费的Redis Desktop Manager和免费的Another Redis DeskTop Manager,包括它们的下载、安装和使用方法,以及在使用Another Redis DeskTop Manager连接Redis时可能遇到的问题和解决方案。
146 1
redis学习四、可视化操作工具链接 centos redis,付费Redis Desktop Manager和免费Another Redis DeskTop Manager下载、安装
|
2月前
|
NoSQL Linux Redis
Docker学习二(Centos):Docker安装并运行redis(成功运行)
这篇文章介绍了在CentOS系统上使用Docker安装并运行Redis数据库的详细步骤,包括拉取Redis镜像、创建挂载目录、下载配置文件、修改配置以及使用Docker命令运行Redis容器,并检查运行状态和使用Navicat连接Redis。
320 3
|
6月前
|
NoSQL Java Redis
Redis系列学习文章分享---第十八篇(Redis原理篇--网络模型,通讯协议,内存回收)
Redis系列学习文章分享---第十八篇(Redis原理篇--网络模型,通讯协议,内存回收)
87 0
|
6月前
|
存储 消息中间件 缓存
Redis系列学习文章分享---第十七篇(Redis原理篇--数据结构,网络模型)
Redis系列学习文章分享---第十七篇(Redis原理篇--数据结构,网络模型)
99 0
|
6月前
|
存储 NoSQL 算法
Redis系列学习文章分享---第十篇(Redis快速入门之附近商铺+用户签到+UV统计)
Redis系列学习文章分享---第十篇(Redis快速入门之附近商铺+用户签到+UV统计)
45 0
|
6月前
|
存储 NoSQL Redis
Redis系列学习文章分享---第九篇(Redis快速入门之好友关注--关注和取关 -共同关注 -Feed流实现方案分析 -推送到粉丝收件箱 -滚动分页查询)
Redis系列学习文章分享---第九篇(Redis快速入门之好友关注--关注和取关 -共同关注 -Feed流实现方案分析 -推送到粉丝收件箱 -滚动分页查询)
70 0
|
6月前
|
消息中间件 负载均衡 NoSQL
Redis系列学习文章分享---第七篇(Redis快速入门之消息队列--List实现消息队列 Pubsub实现消息队列 stream的单消费模式 stream的消费者组模式 基于stream消息队列)
Redis系列学习文章分享---第七篇(Redis快速入门之消息队列--List实现消息队列 Pubsub实现消息队列 stream的单消费模式 stream的消费者组模式 基于stream消息队列)
77 0
|
6月前
|
消息中间件 NoSQL Java
Redis系列学习文章分享---第六篇(Redis实战篇--Redis分布式锁+实现思路+误删问题+原子性+lua脚本+Redisson功能介绍+可重入锁+WatchDog机制+multiLock)
Redis系列学习文章分享---第六篇(Redis实战篇--Redis分布式锁+实现思路+误删问题+原子性+lua脚本+Redisson功能介绍+可重入锁+WatchDog机制+multiLock)
242 0
|
2月前
|
NoSQL Java Redis
shiro学习四:使用springboot整合shiro,正常的企业级后端开发shiro认证鉴权流程。使用redis做token的过滤。md5做密码的加密。
这篇文章介绍了如何使用Spring Boot整合Apache Shiro框架进行后端开发,包括认证和授权流程,并使用Redis存储Token以及MD5加密用户密码。
37 0
shiro学习四:使用springboot整合shiro,正常的企业级后端开发shiro认证鉴权流程。使用redis做token的过滤。md5做密码的加密。