被鹅厂搞懵逼了(更正)

简介: 在 FIN_WAIT_2 状态下如何处理乱序的 FIN 报文

大家好,我是小林。

上周发了一篇读者面试鹅厂遇到的网络问题:又被鹅厂搞懵了!

1.jpg

当时我的关注点放在了「TIME_WAIT 状态下,接收到了数据包会怎么处理?」然后那篇文章留言区有人说这题的重点并不是想问「在 TIME_WAIT 状态下对数据包的如何处理」。而是 「在 FIN_WAIT_2 状态下如何处理乱序的 FIN 报文」。5.png

随后,我自己去看了 Linux 的源码,验证了这位读者的思路是没问题的。果然一个人思考容易形成思维定势,和别人交流可能才能发现自己没有注意到的点。这道鹅厂的网络题可能是提问的读者表述有问题,因为如果 FIN 报文比数据包先抵达客户端,此时 FIN 报文其实是一个乱序的报文,此时客户端的 TCP 连接并不会从 FIN_WAIT_2 状态转换到 TIME_WAIT 状态。

因此,我们要关注到点是看「在 FIN_WAIT_2 状态下,是如何处理收到的乱序到 FIN 报文,然后 TCP 连接又是什么时候才进入到 TIME_WAIT 状态?」。

我这里先直接说结论:在 FIN_WAIT_2 状态时,如果收到乱序的 FIN 报文,那么就被会加入到「乱序队列」,并不会进入到 TIME_WAIT 状态。等再次收到前面被网络延迟的数据包时,会判断乱序队列有没有数据,然后会检测乱序队列中是否有可用的数据,如果能在乱序队列中找到与当前报文的序列号保持的顺序的报文,就会看该报文是否有 FIN 标志,如果发现有 FIN 标志,这时才会进入 TIME_WAIT 状态。我也画了一张图,大家可以结合着图来理解。

image.gif

TCP 源码分析


接下来,我带大家看看源码,听到要源码分析,可能有的同学就怂了。其实要分析我们今天这个问题,只要懂 if else 就行了,我也会用中文来表述代码的逻辑,所以单纯看我的文字也是可以的。这次我们重点分析的是,在 FIN_WAIT_2 状态下,收到 FIN 报文是如何处理的。在 Linux 内核里,当 IP 层处理完消息后,会通过回调 tcp_v4_rcv 函数将消息转给 TCP 层,所以这个函数就是 TCP 层收到消息的入口。

12.jpg

处于 FIN_WAIT_2 状态下的客户端,在收到服务端的报文后,最终会调用 tcp_v4_do_rcv 函数。

1.jpg

接下来,tcp_v4_do_rcv 方法会调用 tcp_rcv_state_process,在这里会根据 TCP 状态做对应的处理,这里我们只关注 FIN_WAIT_2 状态。

0.jpg

在上面这个代码里,可以看到如果 shutdown 关闭了读方向,那么在收到对方发来的数据包,则会回复 RST 报文。而我们这次的题目里, shutdown 只关闭了写方向,所以会继续往下调用 tcp_data_queue 函数(因为 case TCP_FIN_WAIT2 代码块里并没有 break 语句,所以会走到该函数)。9.jpg

在上面的 tcp_data_queue 函数里,如果收到的报文的序列号是我们预期的,也就是有序的话:

  • 会判断该报文有没有 FIN 标志,如果有的话就会调用 tcp_fin 函数,这个函数负责将 FIN_WAIT_2 状态转换为 TIME_WAIT。
  • 接着还会看乱序队列有没有数据,如果有的话会调用 tcp_ofo_queue 函数,这个函数负责检查乱序队列中是否有数据包可用,即能不能在乱序队列找到与当前数据包保持序列号连续的数据包。

而当收到的报文的序列号不是我们预期的,也就是乱序的话,则调用 tcp_data_queue_ofo 函数,将报文加入到乱序队列,这个队列的数据结构是红黑树。我们的题目里,客户端收到的 FIN 报文实际上是一个乱序的报文,因此此时并不会调用 tcp_fin 函数进行状态转换,而是将报文通过 tcp_data_queue_ofo 函数加入到乱序队列。然后当客户端收到被网络延迟的数据包后,此时因为该数据包的序列号是期望的,然后又因为上一次收到的乱序 FIN 报文被加入到了乱序队列,表明乱序队列是有数据的,于是就会调用 tcp_ofo_queue 函数。我们来看看 tcp_ofo_queue 函数。8.jpg

在上面的 tcp_ofo_queue 函数里,在乱序队列中找到能与当前报文的序列号保持的顺序的报文后,会看该报文是否有 FIN 标志,如果有的话,就会调用 tcp_fin() 函数。最后,我们来看看 tcp_fin 函数的处理。

7.jpg

可以看到,如果当前的 TCP 状态为 TCP_FIN_WAIT2,就会发送第四次挥手 ack,然后调用 tcp_time_wait 函数,这个函数里会将 TCP 状态变更为 TIME_WAIT,并启动 TIME_WAIT 的定时器。


怎么看 TCP 源码?


之前有不少同学问我,我是怎么看 TCP 源码的?其实我看 TCP 源码,并不是直接打开 Linux 源码直接看,因为 Linux 源码实在太庞大了,如果我不知道 TCP 入口函数在哪,那简直就是大海捞针。所以,在看 TCP 源码,我们可以去网上搜索下别人的源码分析,网上已经有很多前辈帮我们分析了 TCP 源码了,而且各个函数的调用链路,他们都有写出来了。比如,你想了解 TCP 三次握手/四次挥手的源码实现,你就可以以「TCP 三次握手/四次挥手的源码分析」这样关键字来搜索,大部分文章的注释写的还是很清晰,我最开始就按这种方式来学习 TCP 源码的。网上的文章一般只会将重点的部分,很多代码细节没有贴出来,如果你想完整的看到函数的所有代码,那就得看内核代码了。今天这道网络题目,在网上其实是搜索不出答案的,而且我们也很难用实验的方式来模拟。所以要想知道答案,只能去看源码。


这次就说到这啦,我们下次见!

目录
打赏
0
0
0
0
1
分享
相关文章
【Netty】主从反应器 ( Reactor ) 多线程模型
【Netty】主从反应器 ( Reactor ) 多线程模型
851 0
【Netty】主从反应器 ( Reactor ) 多线程模型
通义灵码 AI 程序员全面上线,能和人类协作完成复杂开发任务
1 月 8 日消息,阿里云通义灵码 AI 程序员已全面上线,成为全球首个同时支持 VS Code、JetBrains IDEs 开发工具的 AI 程序员产品。此次上线的 AI 程序员相比传统 AI 辅助编程工具,能力更全面,可以让开发者以更高效、更沉浸的方式完成编码任务,通过全程对话协作的方式,就能完成从 0 到 1 的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。
497 65
Spring Boot中的全局异常处理
主要讲解了Spring Boot 的全局异常处理,包括异常信息的封装、异常信息的捕获和处理,以及在实际项目中,我们用到的自定义异常枚举类和业务异常的捕获与处理,在项目中运用的非常广泛,基本上每个项目中都需要做全局异常处理。
云上智能投顾:重塑个人理财的新纪元
数据安全与隐私保护:随着投资者信息的不断增加如何确保数据的安全性和隐私性成为亟待解决的问题。 技术成熟度与稳定性:目前云上智能投顾技术仍处于不断发展和完善阶段其技术成熟度和稳定性仍需进一步提升。 投资者教育与信任度:部分投资者对新兴的智能投顾技术持怀疑态度如何提升投资者的信任度和接受度也是一大挑战。 五、未来展望 随着技术的不断进步和市场环境的不断变化云上智能投顾将迎来更加广阔的发展前景。未来云上智能投顾将更加注重数据安全和隐私保护加强技术研发提升技术成熟度和稳定性;同时加强与金融机构、科技企业的合作共同推动智能投顾行业的健康发展;此外还将积极探索新的应用场景和服务模式如企业投顾、公益投顾等以
269 7
【技术深度解析】多平台适配下的UI适配难题:U3D游戏UI错乱的终极解决方案
【7月更文第12天】随着移动设备市场的多元化,Unity游戏开发者面临的一大挑战是如何在不同分辨率和屏幕尺寸的设备上保持UI的一致性和美观性。游戏在高分辨率平板与低分辨率手机上呈现出的UI布局混乱、按钮错位等问题,严重影响玩家体验。本文旨在探讨Unity UI(UGUI)在多平台适配中的最佳实践,通过优化Canvas Scaler设置、灵活运用RectTransform和Anchor Points,以及高效利用设计工具,确保UI的完美适配。
1485 1
计算机学习笔记(二)
TCP的四次挥手(FIN-WAIT-2、CLOSE-WAIT、FIN-WAIT-1、LAST-ACK、TIME-WAIT状态)确保了双方安全关闭连接。挥手过程包括客户端发送FIN,服务器确认并可能发送剩余数据,最终双方都发送FIN并确认,确保所有数据传输完毕。四次挥手的目的是防止已关闭的一方在最后的确认之前发送的数据丢失。 四次挥手的必要性是因为TCP是全双工的,每个方向都需要单独关闭。最后一次ACK确保服务器收到客户端的关闭请求,防止数据丢失。
85 0
35Echarts - 柱状图(交错正负轴标签)
35Echarts - 柱状图(交错正负轴标签)
298 0
MySQL 数据访问与查询优化:提升性能的实战策略和解耦优化技巧(三)
MySQL 数据访问与查询优化:提升性能的实战策略和解耦优化技巧(三)
412 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问