深入Netty逻辑架构,从Reactor线程模型开始(一)

简介: 深入Netty逻辑架构,从Reactor线程模型开始(一)

1.什么是Reactor线程模型?


先来回顾下我们在Netty系列的第2篇介绍的I/O线程模型,包括BIO、NIO、I/O多路复用、信号驱动IO、AIO。IO多路复用在Java中有专门的NIO包封装了相关的方法。


前面的文章也说过,使用Netty而不是直接使用Java NIO包,就是因为Netty帮我们封装了许多对NIO包的使用细节,做了许多优化。


其中非常著名的,就是Netty的「Reactor线程模型」。


前置知识如果还不太清楚,可以回头看看前面几篇文章:


《没搞清楚网络I/O模型?那怎么入门Netty》
《从网络I/O模型到Netty,先深入了解下I/O多路复用》
《从I/O多路复用到Netty,还要跨过Java NIO包》


Reactor模式 是一种「事件驱动」模式。


「Reactor线程模型」就是通过 单个线程 使用Java NIO包中的Selector的select()方法,进行监听。当获取到事件(如accept、read等)后,就会分配(dispatch)事件进行相应的事件处理(handle)。


如果要给 Reactor线程模型 下一个更明确的定义,应该是:


Reactor线程模式 = Reactor(I/O多路复用)+ 线程池


其中Reactor负责监听和分配事件,线程池负责处理事件。


然后,根据Reactor的数量和线程池的数量,又可以将Reactor分为三种模型


  • 单Reactor单线程模型 (固定大小为1的线程池)
  • 单Reactor多线程模型
  • 多Reactor多线程模型 (一般是主从2个Reactor)


1.1 单Reactor单线程模型


77.png


Reactor内部通过 selector 监听连接事件,收到事件后通过dispatch进行分发。


  • 如果是连接建立的事件,通过accept接受连接,并创建一个Handler来处理连接后续的各种事件。
  • 如果是读写事件,直接调用连接对应的Handler来处理,Handler完成 read => (decode => compute => encode) => send 的全部流程


这个过程中,无论是事件监听、事件分发、还是事件处理,都始终只有 一个线程 执行所有的事情。


缺点:
在请求过多时,会无法支撑。因为只有一个线程,无法发挥多核CPU性能。
而且一旦某个Handler发生阻塞,服务端就完全无法处理其他连接事件。


1.2 单Reactor多线程模型


为了提高性能,我们可以把复杂的事件处理handler交给线程池,那就可以演进为 「单Reactor多线程模型」


78.png


这种模型和第一种模型的主要区别是把业务处理从之前的单一线程脱离出来,换成线程池处理。


1)Reactor线程


通过select监听客户请求,如果是连接建立的事件,通过accept接受连接,并创建一个Handler来处理连接后续的读写事件。这里的Handler只负责响应事件、read和write事件,会将具体的业务处理交由Worker线程池处理。


只处理连接事件、读写事件。


2)Worker线程池


处理所有业务事件,包括(decode => compute => encode) 过程。


充分利用多核机器的资源,提高性能。


缺点:
在极个别特殊场景中,一个Reactor线程负责监听和处理所有的客户端连接可能会存在性能问题。例如并发百万客户端连接(双十一、春运抢票)


1.3 多Reactor多线程模型


为了充分利用多核能力,可以构建两个 Reactor,这就演进为 「主从Reactor线程模型」

79.png


1)主Reactor


主 Reactor 单独监听server socket,accept新连接,然后将建立的 SocketChannel 注册给指定的 从Reactor,


2)从Reactor


从Reactor 将连接加入到连接队列进行监听,并创建handler进行事件处理。执行事件的读写、分发,把业务处理就扔给worker线程池完成。


3)Worker线程池


处理所有业务事件,充分利用多核机器的资源,提高性能。


轻松处理百万并发。


缺点:
实现比较复杂。


不过有了Netty,一切都变得简单了。


Netty帮我们封装好了一切,可以快速使用主从Reactor线程模型(Netty4的实现上增加了无锁串行化设计),具体代码这里就不贴了,可以看看上一篇的Demo。


2. EventLoop、EventLoopGroup 怎么实现Reactor线程模型?


上面我们已经了解了Reactor线程模型,了解了它的核心就是:


Reactor线程模式 = Reactor(I/O多路复用)+ 线程池


它的运行模式包括四个步骤:


  • 连接注册:建立连接后,将channel注册到selector上
  • 事件轮询:selcetor上轮询(select()函数)获取已经注册的channel的所有I/O事件(多路复用)
  • 事件分发:把准备就绪的I/O事件分配到对应线程进行处理
  • 事件处理:每个worker线程执行事件任务


那这样的模型在Netty中具体怎么实现呢?


这就需要我们了解下EventLoop和EventLoopGroup了。


2.1 EventLoop是什么


EventLoop 不是Netty独有的,它本身是一个通用的 事件等待和处理的程序模型。主要用来解决多线程资源消耗高的问题。例如 Node.js 就采用了 EventLoop 的运行机制。


那么,在Netty中,EventLoop是什么呢?


  • 一个Reactor模型的事件处理器。
  • 单独一个线程。
  • 一个EventLoop内部会维护一个selector和一个「taskQueue任务队列」,分别负责处理 「I/O事件」 和 「任务」。


「taskQueue任务队列」是多生产者单消费者队列,在多线程并发添加任务时,可以保证线程安全。


「I/O事件」即selectionKey中的事件,如accept、connect、read、write等;


「任务」包括 普通任务、定时任务等。


  • 普通任务:通过 NioEventLoop 的 execute() 方法向任务队列 taskQueue 中添加任务。例如 Netty 在写数据时会封装 WriteAndFlushTask 提交给 taskQueue。
  • 定时任务:通过调用 NioEventLoop 的 schedule() 方法向 定时任务队列 scheduledTaskQueue 添加一个定时任务,用于周期性执行该任务(如心跳消息发送等)。定时任务队列的任务 到了执行时间后,会合并到 普通任务 队列中进行真正执行。


一图胜千言:

80.png


EventLoop单线程运行,循环往复执行三个动作:


  • selector事件轮询
  • I/O事件处理
  • 任务处理


2.2 EventLoopGroup是什么


EventLoopGroup比较简单,可以简单理解为一个“EventLoop线程池”。

81.png


Tips:

监听一个端口,只会绑定到 BossEventLoopGroup 中的一个 Eventloop,所以, BossEventLoopGroup 配置多个线程也无用,除非你同时监听多个端口。


2.3 具体实现


Netty可以通过简单配置,支持单Reactor单线程模型 、单Reactor多线程模型 、多Reactor多线程模型。


我们以 「多Reactor多线程模型」 为例,来看看Netty是如何通过EventLoop来实现的。


还是一图胜千言:


82.png


我们结合Reactor线程模型的四个步骤来梳理一下:


1)连接注册


master EventLoopGroup中有一个EventLoop,绑定某个特定端口进行监听。


一旦有新的连接进来触发accept类型事件,就会在当前EventLoop的I/O事件处理阶段,将这个连接分配给slave EventLoopGroup中的某一个EventLoop,进行后续 事件的监听。


2)事件轮询


slave EventLoopGroup中的EventLoop,会通过selcetor对绑定到自身的channel进行轮询,获取已经注册的channel的所有I/O事件(多路复用)。


当然,EventLoopGroup中会有 多个EventLoop 运行,各自循环处理。具体EventLoop数量是由 用户指定的线程数 或者 默认为核数的2倍。


3)事件分发


当slave EventLoopGroup中的EventLoop获取到I/O事件后,会在EventLoop的 I/O事件处理(processSelectedKeys) 阶段分发给对应ChannelPipeline进行处理。


注意,仍然在当前线程进行串行处理


4)事件处理


在ChannelPipeline中对I/O事件进行处理。


I/O事件处理完后,EventLoop在 任务处理(runAllTasks) 阶段,对队列中的任务进行消费处理。


至此,我们就能完全梳理清楚EventLoopGroup/EventLoop 和 Reactor线程模型的关系了。


咦,好像有什么地方不对劲?


没错,细心的朋友可能会发现,slave EventLoopGroup中并不是


一个selector + 线程池


而是有多个EventLoop组成的


多selector + 多个单线程


这是为什么呢?


那就得继续深入了解下Netty4的线程模型优化了。

目录
相关文章
|
3月前
|
机器学习/深度学习 自然语言处理 分布式计算
大规模语言模型与生成模型:技术原理、架构与应用
本文深入探讨了大规模语言模型(LLMs)和生成模型的技术原理、经典架构及应用。介绍了LLMs的关键特点,如海量数据训练、深层架构和自监督学习,以及常见模型如GPT、BERT和T5。同时,文章详细解析了生成模型的工作原理,包括自回归模型、自编码器和GANs,并讨论了这些模型在自然语言生成、机器翻译、对话系统和数据增强等领域的应用。最后,文章展望了未来的发展趋势,如模型压缩、跨模态生成和多语言多任务学习。
350 3
|
9天前
|
自然语言处理 算法 JavaScript
面向长文本的多模型协作摘要架构:多LLM文本摘要方法
多LLM摘要框架通过生成和评估两个步骤处理长文档,支持集中式和分散式两种策略。每个LLM独立生成文本摘要,集中式方法由单一LLM评估并选择最佳摘要,而分散式方法则由多个LLM共同评估,达成共识。论文提出两阶段流程:先分块摘要,再汇总生成最终摘要。实验结果显示,多LLM框架显著优于单LLM基准,性能提升最高达3倍,且仅需少量LLM和一轮生成评估即可获得显著效果。
44 10
面向长文本的多模型协作摘要架构:多LLM文本摘要方法
|
24天前
|
机器学习/深度学习 编解码 vr&ar
NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
本文详细解读NeurIPS 2024最佳论文《视觉自回归建模:基于下一尺度预测的可扩展图像生成》。该研究提出VAR模型,通过多尺度token图和VAR Transformer结构,实现高效、高质量的图像生成,解决了传统自回归模型在二维结构信息、泛化能力和计算效率上的局限。实验表明,VAR在图像质量和速度上超越现有扩散模型,并展示出良好的扩展性和零样本泛化能力。未来研究将聚焦于文本引导生成和视频生成等方向。
104 8
NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
|
14天前
|
搜索推荐 架构师 数据挖掘
架构实操:画好一张业务模型图
本文以SDK设计的角度分析了如何构建一张属于SDK的各个业务的模型图。
|
4月前
|
存储 分布式计算 API
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
165 0
|
2月前
|
机器学习/深度学习 测试技术 定位技术
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
近期,一篇题为“OmniGen: Unified Image Generation”的论文介绍了一种新型扩散模型OmniGen,旨在统一图像生成任务。OmniGen架构简洁,无需额外模块即可处理多种任务,如文本到图像生成、图像编辑等。该模型通过修正流优化,展现出与现有模型相当或更优的性能,尤其在图像编辑和视觉条件生成方面表现突出。OmniGen仅含3.8亿参数,却能有效处理复杂任务,简化工作流程。尽管如此,OmniGen仍存在对文本提示敏感、文本渲染能力有限等问题,未来研究将继续优化其架构与功能。
72 16
|
3月前
|
机器学习/深度学习 自然语言处理 C++
TSMamba:基于Mamba架构的高效时间序列预测基础模型
TSMamba通过其创新的架构设计和训练策略,成功解决了传统时间序列预测模型面临的多个关键问题。
274 4
TSMamba:基于Mamba架构的高效时间序列预测基础模型
|
3月前
|
网络协议 网络架构
TCP/IP协议架构:四层模型详解
在网络通信的世界里,TCP/IP协议栈是构建现代互联网的基础。本文将深入探讨TCP/IP协议涉及的四层架构,以及每一层的关键功能和作用。
273 5
|
3月前
|
机器学习/深度学习 存储 人工智能
【AI系统】模型演进与经典架构
本文探讨了AI计算模式对AI芯片设计的重要性,通过分析经典模型结构设计与演进、模型量化与压缩等核心内容,揭示了神经网络模型的发展现状及优化方向。文章详细介绍了神经网络的基本组件、主流模型结构、以及模型量化和剪枝技术,强调了这些技术在提高模型效率、降低计算和存储需求方面的关键作用。基于此,提出了AI芯片设计应考虑支持神经网络计算逻辑、高维张量存储与计算、灵活的软件配置接口、不同bit位数的计算单元和存储格式等建议,以适应不断发展的AI技术需求。
60 5
|
4月前
|
机器学习/深度学习 网络架构 计算机视觉
目标检测笔记(一):不同模型的网络架构介绍和代码
这篇文章介绍了ShuffleNetV2网络架构及其代码实现,包括模型结构、代码细节和不同版本的模型。ShuffleNetV2是一个高效的卷积神经网络,适用于深度学习中的目标检测任务。
142 1
目标检测笔记(一):不同模型的网络架构介绍和代码

热门文章

最新文章