高性能网络框架Netty的TCP拆包、粘包解决方案

简介: 简单地说,网络通信时由于TCP会对传输的数据报进行对用户透明的拆分与重新组装,然后将拆分后的分别发送,而我们接收时要获取发送时的数据报,如何再对其拆分与组装,以便于我们能知道报文的意思,这个提取报文的过程就是TCP的拆包与粘包,在我们自己做底层的通信设计时,这是必须要考虑的。

简单地说,网络通信时由于TCP会对传输的数据进行对用户透明的拆分与重新组装,然后将拆分后的分别发送,而我们接收时要获取发送时的数据报,如何再对其拆分与组装,以便于我们能知道报文的意思,这个提取报文的过程就是TCP的拆包与粘包,在我们自己做底层的通信设计时,这是必须要考虑的。结合最近在做一个和通信相关的项目,本文讲几个经典且常用的几种粘包与拆包方法及其在Netty中的实现,Netty是高性能的通信框架,Netty和另一个通信框架Apache的MINA比较像,而且他们作者相同。关于Netty4与MINA2我做过一次比较总结,并将PPT上传在了网上,地址:http://share.csdn.net/slides/8056

进入主题,Netty提供的拆包与粘包工具类:

1、 基于长度字段
 io.netty.handler.codec.LengthFieldPrepender

类关系图如下:

原理和下面的io.netty.handler.codec.LengthFieldBasedFrameDecoder原理类似,不同是这个在编码的过程使用,

例如原报文数据如下:

 +----------------------------+
  | "HELLO, WORLD" |
 +----------------------------+

长度占2个字节且不包含本身的拆包粘包结果如下:

 +-----------+--------------------------+
  | 0x000C | "HELLO, WORLD" |
 +-----------+--------------------------+

长度占2个字节且包含本身的拆包粘包结果如下:

 +------------+----------------------------+
  | 0x000E | "HELLO, WORLD" |
 +------------+----------------------------+

 2、基于界定符解码器
 io.netty.handler.codec.DelimiterBasedFrameDecoder

类关系图如下:

原理如下:

假设收到的报文如下:

 +--------------------+
  | ABC\nDEF\r\n |
 +--------------------+

如果以‘\n’为界定符,则拆包粘包后的报文就是:

 +--------+-------+
  | ABC | DEF |
 +--------+-------+

如果以‘\r\n’为界定符,则拆包粘包后的报文就是:

 +-----------------+
  | ABC\nDEF |
 +-----------------+


 3、基于定长解码器
 io.netty.handler.codec.FixedLengthFrameDecoder

类关系图如下:


 定长就是指定了报文的长度,解析时就是按长度组合截取,原理如下:

假设接收到的报文如下:

 +----+-----+---------+----+
  | A | BC | DEFG | HI |
 +----+-----+---------+----+

当定长参数为3时,拆包与粘包的结果是:

 +--------+-------+------+
  | ABC | DEF | GHI |
 +--------+-------+------+


4、基于长度字段解码器
 io.netty.handler.codec.LengthFieldBasedFrameDecoder

类关系图如下:


 所谓长字段就是在报文里有说明报文总长度的字段,其实在TCP的报文规则里就用的这个方法,在头部存放报文总长或除报头的内容总长,具体如下:

长度包含长度字段本身且不排除本身的拆包与粘包:

 lengthFieldOffset   = 0     长度字段偏移量
 lengthFieldLength   = 2    长度字段所占长度
 lengthAdjustment    = 0   
 initialBytesToStrip = 0      (要排除的用于初始化的偏移位置)

         解码前 (14 bytes)                                    解码后 (14 bytes)
 +------------+---------------------------+             +------------+---------------------------+
  | Length  |    Actual Content   |   ----->    | Length  |    Actual Content   |
  | 0x000C | "HELLO, WORLD" |             | 0x000C | "HELLO, WORLD" |
 +------------+----------------------------+            +-----------+----------------------------+

长度包含长度字段本身且排除本身的拆包与粘包:

 lengthFieldOffset   = 0     长度字段偏移量
 lengthFieldLength   = 2     长度字段所占长度
 lengthAdjustment    = 0
 initialBytesToStrip = 2 (排除头部)

            解码前 (14 bytes)                        解码后 (12 bytes)
 +------------+----------------------------+           +---------------------------+
  | Length  |    Actual Content    |     ----->|   Actual Content    |
  | 0x000C | "HELLO, WORLD" |            | "HELLO, WORLD" |
 +------------+----------------------------+          +----------------------------+
 

长度包含长度字段本身且不排除本身的拆包与粘包:

 lengthFieldOffset   =  0   长度字段偏移量
 lengthFieldLength   =  2   长度字段偏移量
 lengthAdjustment    = -2  调整长度 (长度字段所占长度)
 initialBytesToStrip =  0

      解码前 (14 bytes)                                   解码后 (14 bytes)
 +------------+----------------------------+             +-----------+----------------------------+
  | Length  |    Actual Content    |   ----->    | Length  |    Actual Content   |
  | 0x000E | "HELLO, WORLD" |              | 0x000E | "HELLO, WORLD" |
 +------------+----------------------------+             +-----------+----------------------------+

 

有外部头部的拆包与粘包:

 lengthFieldOffset   = 2        长度字段偏移量 ( = 外部头部Header 1的长度)
 lengthFieldLength   = 3      长度字段占用字节数
 lengthAdjustment    = 0
 initialBytesToStrip = 0

                解码前 (17 bytes)                                                                  解码后 (17 bytes)
 +--------------+--------------+--------------------------+              +-------------+---------------+--------------------------+
  | Header 1 |     Length   |     Actual Content    |    ----->   | Header 1 |    Length    |     Actual Content    |
  |  0xCAFE   | 0x00000C | "HELLO, WORLD" |                |  0xCAFE   | 0x00000C | "HELLO, WORLD" |
 +--------------+--------------+--------------------------+              +--------------+--------------+--------------------------+

长度字段在前且有扩展头部的拆包与粘包:

 lengthFieldOffset   = 0    长度字段偏移量
 lengthFieldLength   = 3   长度字段占用字节数
 lengthAdjustment    = 2 ( Header 1 的长度)
 initialBytesToStrip = 0

                        解码前 (17 bytes)                                                   解码后 (17 bytes)
 +----------------+---------------+---------------------------+              +---------------+----------------+---------------------------+
  |    Length   |  Header 1 |    Actual Content   |    ----->    |    Length   |   Header 1 |   Actual Content    |
  | 0x00000C |  0xCAFE  | "HELLO, WORLD" |               | 0x00000C |  0xCAFE  | "HELLO, WORLD" |
 +----------------+---------------+---------------------------+              +---------------+----------------+---------------------------+

多扩展头部的拆包与粘包:

 lengthFieldOffset   = 1    长度字段偏移量(=头HDR1的长度)
 lengthFieldLength   = 2   长度字段占用字节数
 lengthAdjustment    = 1  调整长度(= HDR2的长度)
 initialBytesToStrip = 3     排除的偏移量(= the length of HDR1 + LEN)

                       解码前 (16 bytes)                                           解码后 (13 bytes)
 +----------+-----------+----------+----------------------------+              +----------+---------------------------+
  | HDR1 | Length  | HDR2 |   Actual Content     |     ----->    | HDR2 |    Actual Content   |
  | 0xCA | 0x000C |  0xFE | "HELLO, WORLD" |                |  0xFE | "HELLO, WORLD" |
 +---------+------------+----------+---------------------------+               +----------+---------------------------+

调整的多扩展头部的拆包与粘包:

 lengthFieldOffset   =  1        长度字段偏移量(=头HDR1的长度)
 lengthFieldLength   =  2      长度字段占用字节数
 lengthAdjustment    = -3      (= the length of HDR1 + LEN, negative)
 initialBytesToStrip =  3        排除的偏移量(= the length of HDR1 + LEN)

                   解码前 (16 bytes)                                                        解码后 (13 bytes)
 +---------+-----------+---------+--------------------------+                 +---------+-------------------------+
  | HDR1 | Length  | HDR2 |    Actual Content     |     ----->     | HDR2 |     Actual Content   |
  |  0xCA  | 0x0010 |  0xFE   | "HELLO, WORLD" |                   |  0xFE  | "HELLO, WORLD" |
 +---------+-----------+---------+--------------------------+                 +---------+-------------------------+


5、基于换行符解码器
 io.netty.handler.codec.LineBasedFrameDecoder

类关系图如下:

英文的解释是:A decoder that splits the received ByteBufs on line endings.

一行的结束标志包括: "\n" 和 "\r\n",所以又属于io.netty.handler.codec.FixedLengthFrameDecoder的范畴。


6、关于Netty中的ByteBuf

由于Netty底层是ByteBuf的结构特殊,具有双指针(读指针和写指针)如下:

所以相比MINA的ChannelBuffer的性能要高很多,这也是拆包与粘包的应用之处,就是如何将byte数组转换成我们想要的Messgae。

从类的关系图中我们可以看到Netty里两种数据流向,其实这是ChannelPipeline(管道)中的两种处理链,如图所示:

所以处理连接是继承类ChannelInboundHandlerAdapter,如下:


用Netty创建服务并且用能到这些拆包与粘的地方的代码如下(第36行处):


总结一下:和拆包与粘包相关的还有就是大小端,也就是高位与低位的位置问题,这些都与编解码相关,通信相关的问题也是这些问题,

今天基本上讲清楚了TCP拆包与粘包,其中引例来自Netty中的注释,我翻译了一下,可能有些地方翻译的不是很到位,感兴趣的可以直接看Netty4的源码。

目录
相关文章
|
6月前
|
C++
基于Reactor模型的高性能网络库之地址篇
这段代码定义了一个 InetAddress 类,是 C++ 网络编程中用于封装 IPv4 地址和端口的常见做法。该类的主要作用是方便地表示和操作一个网络地址(IP + 端口)
334 58
|
6月前
|
网络协议 算法 Java
基于Reactor模型的高性能网络库之Tcpserver组件-上层调度器
TcpServer 是一个用于管理 TCP 连接的类,包含成员变量如事件循环(EventLoop)、连接池(ConnectionMap)和回调函数等。其主要功能包括监听新连接、设置线程池、启动服务器及处理连接事件。通过 Acceptor 接收新连接,并使用轮询算法将连接分配给子事件循环(subloop)进行读写操作。调用链从 start() 开始,经由线程池启动和 Acceptor 监听,最终由 TcpConnection 管理具体连接的事件处理。
242 2
|
6月前
基于Reactor模型的高性能网络库之Tcpconnection组件
TcpConnection 由 subLoop 管理 connfd,负责处理具体连接。它封装了连接套接字,通过 Channel 监听可读、可写、关闭、错误等
191 1
|
6月前
|
负载均衡 算法 安全
基于Reactor模式的高性能网络库之线程池组件设计篇
EventLoopThreadPool 是 Reactor 模式中实现“一个主线程 + 多个工作线程”的关键组件,用于高效管理多个 EventLoop 并在多核 CPU 上分担高并发 I/O 压力。通过封装 Thread 类和 EventLoopThread,实现线程创建、管理和事件循环的调度,形成线程池结构。每个 EventLoopThread 管理一个子线程与对应的 EventLoop(subloop),主线程(base loop)通过负载均衡算法将任务派发至各 subloop,从而提升系统性能与并发处理能力。
362 3
|
8月前
|
小程序 前端开发
2025商业版拓展校园圈子论坛网络的创新解决方案:校园跑腿小程序系统架构
校园跑腿小程序系统是一款创新解决方案,旨在满足校园配送需求并拓展校友网络。跑腿员可接单配送,用户能实时跟踪订单并评价服务。系统包含用户、客服、物流、跑腿员及订单模块,功能完善。此外,小程序增设信息咨询发布、校园社区建设和活动组织等功能,助力校友互动、经验分享及感情联络,构建紧密的校友网络。
343 1
2025商业版拓展校园圈子论坛网络的创新解决方案:校园跑腿小程序系统架构
|
6月前
基于Reactor模式的高性能网络库github地址
https://github.com/zyi30/reactor-net.git
167 0
|
6月前
基于Reactor模型的高性能网络库之Poller(EpollPoller)组件
封装底层 I/O 多路复用机制(如 epoll)的抽象类 Poller,提供统一接口支持多种实现。Poller 是一个抽象基类,定义了 Channel 管理、事件收集等核心功能,并与 EventLoop 绑定。其子类 EPollPoller 实现了基于 epoll 的具体操作,包括事件等待、Channel 更新和删除等。通过工厂方法可创建默认的 Poller 实例,实现多态调用。
353 60
|
6月前
基于Reactor模型的高性能网络库之Channel组件篇
Channel 是事件通道,它绑定某个文件描述符 fd,注册感兴趣的事件(如读/写),并在事件发生时分发给对应的回调函数。
307 60
|
3月前
|
缓存 人工智能 API
API接口调用中的网络异常及解决方案
淘宝API是淘宝开放平台提供的接口集合,支持商品、交易、用户、营销等数据交互。开发者需注册获取App Key,通过签名认证调用API,结合沙箱测试、OAuth授权与安全策略,实现订单管理、数据监控等应用,提升电商自动化与数据分析能力。
|
6月前
|
安全 调度
基于Reactor模型的高性能网络库之核心调度器:EventLoop组件
它负责:监听事件(如 I/O 可读写、定时器)、分发事件、执行回调、管理事件源 Channel 等。
367 57