Netty源码(三):I/O模型和Java NIO底层原理

简介: 上一篇文章我们主要讲解了Netty的Channel和Pipeline,了解到不同的Channel可以提供基于不同网络协议的通信处理.既然涉及到网络通信,就不得不说一下多线程,同步异步相关的知识了.Netty的网络模型是多线程的Reactor模式,所有I.

上一篇文章我们主要讲解了Netty的 ChannelPipeline,了解到不同的 Channel可以提供基于不同网络协议的通信处理.既然涉及到网络通信,就不得不说一下多线程,同步异步相关的知识了.Netty的网络模型是多线程的 Reactor模式,所有I/O请求都是异步调用,我们今天就来探讨一下一些基础概念和Java NIO的底层机制.

 为了节约你的时间,本文主要内容如下:

  • 异步,阻塞的概念

  • 操作系统I/O的类型

  • Java NIO的Linux底层实现

异步,同步,阻塞,非阻塞

同步和异步关注的是消息通信机制,所谓同步就是调用者进行调用后,在没有得到结果之前,该调用一直不会返回,但是一旦调用返回,就得到了返回值,同步就是指调用者主动等待调用结果;而异步则相反,执行调用之后直接返回,所以可能没有返回值,等到有返回值时,由被调用者通过状态,通知来通知调用者.异步就是指被调用者来通知调用者调用结果就绪所以,二者在消息通信机制上有所不同,一个是调用者检查调用结果是否就绪,一个是被调用者通知调用者结果就绪*

阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.阻塞调用是指在调用结果返回之前,当前线程会被挂起,调用线程只有在得到结果之后才会继续执行.非阻塞调用是指在不能立刻得到结构之前,调用线程不会被挂起,还是可以执行其他事情.

 两组概念相互组合就有四种情况,分别是同步阻塞,同步非阻塞,异步阻塞,异步非阻塞.我们来举个例子来分别类比上诉四种情况.

 比如你要从网上下载一个1G的文件,按下下载按钮之后,如果你一直在电脑旁边,等待下载结束,这种情况就是同步阻塞;如果你不需要一直呆在电脑旁边,你可以去看一会书,但是你还是隔一段时间来查看一下下载进度,这种情况就是同步非阻塞;如果你一直在电脑旁边,但是下载器在下载结束之后会响起音乐来提醒你,这就是异步阻塞;但是如果你不呆在电脑旁边,去看书,下载器下载结束后响起音乐来提醒你,那么这种情况就是异步非阻塞.

Unix的I/O类型

 知道上述两组概念之后,我们来看一下Unix下可用的5种I/O模型:

  • 阻塞I/O

  • 非阻塞I/O

  • 多路复用I/O

  • 信号驱动I/O

  • 异步I/O

     前4种都是同步,只有最后一种是异步I/O.需要注意的是Java NIO依赖于Unix系统的多路复用I/O,对于I/O操作来说,它是同步I/O,但是对于编程模型来说,它是异步网络调用.下面我们就以系统 read的调用来介绍不同的I/O类型.

     当一个 read发生时,它会经历两个阶段:

  • 1 等待数据准备

  • 2 将数据从内核内存空间拷贝到进程内存空间中

     不同的I/O类型,在这两个阶段中有不同的行为.但是由于这块内容比较多,而且多为表述性的知识,所以这里我们只给出几张图片来解释,具体解释大家可以参看这篇博文

Blocking I/O

NonBlocking I/O

Multiplexing I/O

Asynchronous I/O

对比

Java NIO的Linux底层实现

 我们都知道Netty通过JNI的方式提供了Native Socket Transport,为什么 Netty要提供自己的Native版本的NIO呢?明明Java NIO底层也是基于 epoll调用(最新的版本)的.这里,我们先不明说,大家想一想可能的情况.下列的源码都来自于OpenJDK-8u40-b25版本.

open方法

 如果我们顺着 Selector.open()方法一个类一个类的找下去,很容易就发现 Selector的初始化是由 DefaultSelectorProvider根据不同操作系统平台生成的不同的 SelectorProvider,对于Linux系统,它会生成 EPollSelectorProvider实例,而这个实例会生成 EPollSelectorImpl作为最终的 Selector实现.


  
  
  1. class EPollSelectorImpl extends SelectorImpl
  2. {
  3. .....
  4. // The poll object
  5. EPollArrayWrapper pollWrapper;
  6. .....
  7. EPollSelectorImpl(SelectorProvider sp) throws IOException {
  8. .....
  9. pollWrapper = new EPollArrayWrapper();
  10. pollWrapper.initInterrupt(fd0, fd1);
  11. .....
  12. }
  13. .....
  14. }

EpollArrayWapper将Linux的epoll相关系统调用封装成了native方法供 EpollSelectorImpl使用.


  
  
  1. private native int epollCreate();
  2. private native void epollCtl(int epfd, int opcode, int fd, int events);
  3. private native int epollWait(long pollAddress, int numfds, long timeout,
  4. int epfd) throws IOException;

 上述三个native方法就对应Linux下epoll相关的三个系统调用


  
  
  1. //创建一个epoll句柄,size是这个监听的数目的最大值.
  2. int epoll_create(int size);
  3. //事件注册函数,告诉内核epoll监听什么类型的事件,参数是感兴趣的事件类型,回调和监听的fd
  4. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
  5. //等待事件的产生,类似于select调用,events参数用来从内核得到事件的集合
  6. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);

 所以,我们会发现在 EpollArrayWapper的构造函数中调用了 epollCreate方法,创建了一个epoll的句柄.这样, Selector对象就算创造完毕了.

register方法

 与 open类似, ServerSocketChannelregister函数底层是调用了 SelectorImpl类的 register方法,这个 SelectorImpl就是 EPollSelectorImpl的父类.


  
  
  1. protected final SelectionKey register(AbstractSelectableChannel ch,
  2. int ops,
  3. Object attachment)
  4. {
  5. if (!(ch instanceof SelChImpl))
  6. throw new IllegalSelectorException();
  7. //生成SelectorKey来存储到hashmap中,一共之后获取
  8. SelectionKeyImpl k = new SelectionKeyImpl((SelChImpl)ch, this);
  9. //attach用户想要存储的对象
  10. k.attach(attachment);
  11. //调用子类的implRegister方法
  12. synchronized (publicKeys) {
  13. implRegister(k);
  14. }
  15. //设置关注的option
  16. k.interestOps(ops);
  17. return k;
  18. }

EpollSelectorImpl的相应的方法实现如下,它调用了 EPollArrayWrapperadd方法,记录下Channel所对应的fd值,然后将ski添加到 keys变量中.在 EPollArrayWrapper中有一个byte数组 eventLow记录所有的channel的fd值.


  
  
  1. protected void implRegister(SelectionKeyImpl ski) {
  2. if (closed)
  3. throw new ClosedSelectorException();
  4. SelChImpl ch = ski.channel;
  5. //获取Channel所对应的fd,因为在linux下socket会被当作一个文件,也会有fd
  6. int fd = Integer.valueOf(ch.getFDVal());
  7. fdToKey.put(fd, ski);
  8. //调用pollWrapper的add方法,将channel的fd添加到监控列表中
  9. pollWrapper.add(fd);
  10. //保存到HashSet中,keys是SelectorImpl的成员变量
  11. keys.add(ski);
  12. }

 我们会发现,调用 register方法并没有涉及到 EpollArrayWrapper中的native方法 epollCtl的调用,这是因为他们将这个方法的调用推迟到 Select方法中去了.

Select方法

 和 register方法类似, SelectorImpl中的 select方法最终调用了其子类 EpollSelectorImpldoSelect方法


  
  
  1. protected int doSelect(long timeout) throws IOException {
  2. .....
  3. try {
  4. ....
  5. //调用了poll方法,底层调用了native的epollCtl和epollWait方法
  6. pollWrapper.poll(timeout);
  7. } finally {
  8. ....
  9. }
  10. ....
  11. //更新selectedKeys,为之后的selectedKeys函数做准备
  12. int numKeysUpdated = updateSelectedKeys();
  13. ....
  14. return numKeysUpdated;
  15. }

 由上述的代码,可以看到, EPollSelectorImpl先调用 EPollArrayWapperpoll方法,然后在更新 SelectedKeys.其中 poll方法会先调用 epollCtl来注册先前在 register方法中保存的Channel的fd和感兴趣的事件类型,然后 epollWait方法等待感兴趣事件的生成,导致线程阻塞.


  
  
  1. int poll(long timeout) throws IOException {
  2. updateRegistrations(); ////先调用epollCtl,更新关注的事件类型
  3. ////导致阻塞,等待事件产生
  4. updated = epollWait(pollArrayAddress, NUM_EPOLLEVENTS, timeout, epfd);
  5. .....
  6. return updated;
  7. }

 等待关注的事件产生之后(或在等待时间超过预先设置的最大时间), epollWait函数就会返回. select函数从阻塞状态恢复.

selectedKeys方法

 我们先来看 SelectorImpl中的 selectedKeys方法.


  
  
  1. //是通过Util.ungrowableSet生成的,不能添加,只能减少
  2. private Set<SelectionKey> publicSelectedKeys;
  3. public Set<SelectionKey> selectedKeys() {
  4. ....
  5. return publicSelectedKeys;
  6. }

 很奇怪啊,怎麽直接就返回 publicSelectedKeys了,难道在 select函数的执行过程中有修改过这个变量吗?

publicSelectedKeys这个对象其实是 selectedKeys变量的一份副本,你可以在 SelectorImpl的构造函数中找到它们俩的关系,我们再回头看一下 selectupdateSelectedKeys方法.


  
  
  1. private int updateSelectedKeys() {
  2. //更新了的keys的个数,或在说是产生的事件的个数
  3. int entries = pollWrapper.updated;
  4. int numKeysUpdated = 0;
  5. for (int i=0; i<entries; i++) {
  6. //对应的channel的fd
  7. int nextFD = pollWrapper.getDescriptor(i);
  8. //通过fd找到对应的SelectionKey
  9. SelectionKeyImpl ski = fdToKey.get(Integer.valueOf(nextFD));
  10. if (ski != null) {
  11. int rOps = pollWrapper.getEventOps(i);
  12. //更新selectedKey变量,并通知响应的channel来做响应的处理
  13. if (selectedKeys.contains(ski)) {
  14. if (ski.channel.translateAndSetReadyOps(rOps, ski)) {
  15. numKeysUpdated++;
  16. }
  17. } else {
  18. ski.channel.translateAndSetReadyOps(rOps, ski);
  19. if ((ski.nioReadyOps() & ski.nioInterestOps()) != 0) {
  20. selectedKeys.add(ski);
  21. numKeysUpdated++;
  22. }
  23. }
  24. }
  25. }
  26. return numKeysUpdated;
  27. }

后记

 看到这里,详细大家都已经了解到了NIO的底层实现了吧.这里我想在说两个问题.

 一是为什么Netty自己又从新实现了一边native相关的NIO底层方法? 听听Netty的创始人是怎麽说的吧链接

 二是看这么多源码,花费这么多时间有什么作用呢?我感觉如果从非功利的角度来看,那么就是纯粹的希望了解的更多,有时候看完源码或在理解了底层原理之后,都会用一种恍然大悟的感觉,比如说 AQS的原理.如果从目的性的角度来看,那么就是你知道底层原理之后,你的把握性就更强了,如果出了问题,你可以更快的找出来,并且解决.除此之外,你还可以按照具体的现实情况,以源码为模板在自己造轮子,实现一个更加符合你当前需求的版本.

 后续如果有时间,我希望好好了解一下epoll的操作系统级别的实现原理.

相关文章
|
10月前
|
监控 Java API
现代 Java IO 高性能实践从原理到落地的高效实现路径与实战指南
本文深入解析现代Java高性能IO实践,涵盖异步非阻塞IO、操作系统优化、大文件处理、响应式网络编程与数据库访问,结合Netty、Reactor等技术落地高并发应用,助力构建高效可扩展的IO系统。
291 0
|
7月前
|
Java 大数据 Go
从混沌到秩序:Java共享内存模型如何通过显式约束驯服并发?
并发编程旨在混乱中建立秩序。本文对比Java共享内存模型与Golang消息传递模型,剖析显式同步与隐式因果的哲学差异,揭示happens-before等机制如何保障内存可见性与数据一致性,展现两大范式的深层分野。(238字)
207 4
|
9月前
|
缓存 前端开发 Java
Java类加载机制与双亲委派模型
本文深入解析Java类加载机制,涵盖类加载过程、类加载器、双亲委派模型、自定义类加载器及实战应用,帮助开发者理解JVM核心原理与实际运用。
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
9月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)
本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。
|
9月前
|
机器学习/深度学习 搜索推荐 数据可视化
Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用(217)
本文探讨 Java 大数据与机器学习在电商用户流失预测与留存策略中的应用。通过构建高精度预测模型与动态分层策略,助力企业提前识别流失用户、精准触达,实现用户留存率与商业价值双提升,为电商应对用户流失提供技术新思路。
|
9月前
|
机器学习/深度学习 存储 分布式计算
Java 大视界 --Java 大数据机器学习模型在金融风险压力测试中的应用与验证(211)
本文探讨了Java大数据与机器学习模型在金融风险压力测试中的创新应用。通过多源数据采集、模型构建与优化,结合随机森林、LSTM等算法,实现信用风险动态评估、市场极端场景模拟与操作风险预警。案例分析展示了花旗银行与蚂蚁集团的智能风控实践,验证了技术在提升风险识别效率与降低金融风险损失方面的显著成效。
|
9月前
|
机器学习/深度学习 自然语言处理 算法
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的对抗训练与鲁棒性提升(205)
本文探讨Java大数据与机器学习在自然语言处理中的对抗训练与鲁棒性提升,分析对抗攻击原理,结合Java技术构建对抗样本、优化训练策略,并通过智能客服等案例展示实际应用效果。
|
10月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。