【后端面经】【缓存】36|Redis 单线程:为什么 Redis 用单线程而 Memcached 用多线程?epoll、poll和select + Reactor模式

简介: 【5月更文挑战第19天】`epoll`、`poll`和`select`是Linux下多路复用IO的三种方式。`select`需要主动调用检查文件描述符,而`epoll`能实现回调,即使不调用`epoll_wait`也能处理就绪事件。`poll`与`select`类似,但支持更多文件描述符。面试时,重点讲解`epoll`的高效性和`Reactor`模式,该模式包括一个分发器和多个处理器,用于处理连接和读写事件。Redis采用单线程模型结合`epoll`的Reactor模式,确保高性能。在Redis 6.0后引入多线程,但基本原理保持不变。

epoll、poll和select

在面试中,这三者有时候会一起问,也就是让你分析三种模型,并且解释三者的优劣。

先来看select,发起select调用的时候会传给select一堆代表连接的文件描述符,内核会帮你检查这些文件描述符。
2024-05-20-21-39-25-image.png

它和epoll的区别是,你必须发起select调用,内核才会一个个帮你问。也就是说,select调用缺乏epoll那种即使你不调用epoll_wait,epoll也会把你准备好的文件描述符放到就绪列表的机制。一句话来说就是:epoll 会提前帮你准备好符合条件的文件描述符,但是 select 不会。

readfds = [] // 一堆文件描述符,作为候选
writefds = [] // 也是一堆文件描述符,作为候选
execpfds = [] // 还是一堆文件描述符,作为候选
select(readfds, writefds, excepfds) // 从这些描述符里面挑出符合条件的

在select方法内部,内核会遍历你传入的这些候选文件描述符,找出你要的。

poll和select的基本原理一样。

面试的时候可以强调一下和性能有关的几个点。


2024-05-20-21-45-06-image.png

在面试中你主要面 epoll 的细节,poll 和 select 你大概提一下就可以。一般情况下你能解释清楚 epoll,就能赢得竞争优势了。在搞清楚了 Redis 使用的系统调用之后,还有一个面试的点,就是 Redis 使用的 Reactor 模式。

Reactor模式

Reactor模式也是广泛使用的IO模式,它的性能很好,Redis也用了Reactor模式。用一句话来说明Reactor模式:一个分发器 + 一堆处理器

一般来说,客户端和服务端的IO交互主要有两类事件:连接事件和读写事件。那么Reactor里面的分发器就是把连接事件交给Acceptor,把读写事件交给对应的Handler。这些Handler最终会调用你真正需要读写数据的业务代码。


2024-05-20-21-47-48-image.png

结合前面讲的epoll,你基本上就能猜到,Redis的Reactor就是调用了epoll,拿到创建连接的套接字,或是可读写的套接字,转发给后面的Acceptor或Handler。


2024-05-20-21-48-53-image.png

在搞清楚这一点之后,接下来你就能够理解各种Reactor的变种了。变种基本上可以分为三类。

  • 把Accetor做成多线程

  • 把Handler做成多线程

  • 把Reactor做成多线程。主线程只监听连接创建的事件,监听到了就交给其他线程处理。其他线程则是监听读写事件,然后调用对应的Handler处理。

2024-05-20-21-51-56-image.png

Redis的特殊之处在于,Redis是单线程的。也就是说,Reactor、Handler、Acceptor都只是一个逻辑上的区分,实际上是同一个线程。所以当面试官问到的时候,把两者结合在一起回答。

为了保证性能最好,Redis使用的是基于epoll的Reactor模式。

Reactor模式可以看成一个分发器 + 一堆处理器。Reactor模式发起epoll之类的系统调用,如果是读写事件,那么就交给Handler处理;如果是连接事件,就交给Acceptor处理。

然后强调一下单线程的Redis是怎么使用这个Reactor模式的。

Redis是单线程模型,所以Reactor、Handler和Acceptor其实都是这个线程。

整个过程是这样的:

  1. Redis中的Reactor调用epoll,拿到符合条件的文件描述符。

  2. 假如说Redis拿到了可读写的描述符,就会执行对应的读写操作。

  3. 如果Redis拿到了创建连接的文件描述符,就会完成连接的初始化,然后准备监听这个连接上的读写事件。

后面在 6.0 的时候,Redis 改成了多线程模型,但是基本原理还是 Reactor + epoll。

最后,你提到了 Redis 的 6.0 新模型,那么面试官就可能会问你两个问题。

  • 同样是基于内存的缓存中间件,为什么 Memcache 用的是多线程模型,而 Redis 用的是单线程模型?

  • Redis 为什么最终又引入了多线程模型?和原本的单线程模型比起来,区别在哪里?

目录
相关文章
|
9月前
|
负载均衡 算法 安全
基于Reactor模式的高性能网络库之线程池组件设计篇
EventLoopThreadPool 是 Reactor 模式中实现“一个主线程 + 多个工作线程”的关键组件,用于高效管理多个 EventLoop 并在多核 CPU 上分担高并发 I/O 压力。通过封装 Thread 类和 EventLoopThread,实现线程创建、管理和事件循环的调度,形成线程池结构。每个 EventLoopThread 管理一个子线程与对应的 EventLoop(subloop),主线程(base loop)通过负载均衡算法将任务派发至各 subloop,从而提升系统性能与并发处理能力。
472 3
|
9月前
|
安全 算法 Java
Java 多线程:线程安全与同步控制的深度解析
本文介绍了 Java 多线程开发的关键技术,涵盖线程的创建与启动、线程安全问题及其解决方案,包括 synchronized 关键字、原子类和线程间通信机制。通过示例代码讲解了多线程编程中的常见问题与优化方法,帮助开发者提升程序性能与稳定性。
380 0
|
9月前
|
数据采集 监控 调度
干货分享“用 多线程 爬取数据”:单线程 + 协程的效率反超 3 倍,这才是 Python 异步的正确打开方式
在 Python 爬虫中,多线程因 GIL 和切换开销效率低下,而协程通过用户态调度实现高并发,大幅提升爬取效率。本文详解协程原理、实战对比多线程性能,并提供最佳实践,助你掌握异步爬虫核心技术。
|
10月前
|
Java 数据挖掘 调度
Java 多线程创建零基础入门新手指南:从零开始全面学习多线程创建方法
本文从零基础角度出发,深入浅出地讲解Java多线程的创建方式。内容涵盖继承`Thread`类、实现`Runnable`接口、使用`Callable`和`Future`接口以及线程池的创建与管理等核心知识点。通过代码示例与应用场景分析,帮助读者理解每种方式的特点及适用场景,理论结合实践,轻松掌握Java多线程编程 essentials。
690 5
|
11月前
|
安全 Java 调度
Netty源码—3.Reactor线程模型二
本文主要介绍了NioEventLoop的执行总体框架、Reactor线程执行一次事件轮询、Reactor线程处理产生IO事件的Channel、Reactor线程处理任务队列之添加任务、Reactor线程处理任务队列之执行任务、NioEventLoop总结。
|
11月前
|
安全 Java
Netty源码—2.Reactor线程模型一
本文主要介绍了关于NioEventLoop的问题整理、理解Reactor线程模型主要分三部分、NioEventLoop的创建和NioEventLoop的启动。
|
10月前
|
机器学习/深度学习 监控 算法
局域网行为监控软件 C# 多线程数据包捕获算法:基于 KMP 模式匹配的内容分析优化方案探索
本文探讨了一种结合KMP算法的多线程数据包捕获与分析方案,用于局域网行为监控。通过C#实现,该系统可高效检测敏感内容、管理URL访问、分析协议及审计日志。实验表明,相较于传统算法,KMP在处理大规模网络流量时效率显著提升。未来可在算法优化、多模式匹配及机器学习等领域进一步研究。
259 0
|
Python
python3多线程中使用线程睡眠
本文详细介绍了Python3多线程编程中使用线程睡眠的基本方法和应用场景。通过 `time.sleep()`函数,可以使线程暂停执行一段指定的时间,从而控制线程的执行节奏。通过实际示例演示了如何在多线程中使用线程睡眠来实现计数器和下载器功能。希望本文能帮助您更好地理解和应用Python多线程编程,提高程序的并发能力和执行效率。
528 20
|
SQL 数据建模 BI
【YashanDB 知识库】用 yasldr 配置 Bulkload 模式作单线程迁移 300G 的业务数据到分布式数据库,迁移任务频繁出错
问题描述 详细版本:YashanDB Server Enterprise Edition Release 23.2.4.100 x86_64 6db1237 影响范围: 离线数据迁移场景,影响业务数据入库。 外场将部分 NewCIS 的报表业务放到分布式数据库,验证 SQL 性能水平。 操作系统环境配置: 125G 内存 32C CPU 2T 的 HDD 磁盘 问题出现的步骤/操作: 1、部署崖山分布式数据库 1mm 1cn 3dn 单线启动 yasldr 数据迁移任务,设置 32 线程的 bulk load 模式 2、观察 yasldr.log 是否出现如下错