TCP拆包和粘包的作用是什么

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 首先我们思考一个问题,应用层的传输一个10M的文件是一次性传输完成,而对于传输层的协议来说,为什么不是一次性传输完成呢。这个有很多原因,比如稳定性,一次发送的数据越多,出错的概率越大。再比如说为了效率,网络中有时候存在并行的路径,拆分数据包就就能更好的利用这些并行的路径。再有,比如发送和接收数据的时候,都存在缓冲区,缓冲区是在内存中开辟的一块空间,目的是缓冲大量的应用频繁的通过网卡收发数据,这个时候,网卡只能一个一个处理应用的请求。当网卡忙不过来的时候,数据就需要排队了。也就是将数据放入缓冲区。如果每个应用都随意发送很大的数据,可能导致其他应用的实时性遭到破坏。

首先我们思考一个问题,应用层的传输一个10M的文件是一次性传输完成,而对于传输层的协议来说,为什么不是一次性传输完成呢。

这个有很多原因,比如稳定性,一次发送的数据越多,出错的概率越大。再比如说为了效率,网络中有时候存在并行的路径,拆分数据包就就能更好的利用这些并行的路径。再有,比如发送和接收数据的时候,都存在缓冲区,缓冲区是在内存中开辟的一块空间,目的是缓冲大量的应用频繁的通过网卡收发数据,这个时候,网卡只能一个一个处理应用的请求。当网卡忙不过来的时候,数据就需要排队了。也就是将数据放入缓冲区。如果每个应用都随意发送很大的数据,可能导致其他应用的实时性遭到破坏。

所以,就是传输层的封装包不能太大。这种限制,一般是以缓冲区大小为单位的,也就是TCP协议,会将数据拆分为不超过缓冲区大小的一个个部分。每个部分叫做TCP段(TCP Segment)。

在接收数据的时候,一个个TCP段被重组成原来的数据。

像这样,数据经过拆分,然后传输,然后在目的地重组,就叫拆包。所以拆包就是将数据拆分为多个TCP段传输。有时候,如果发往一个目的地的多个数据太小了,为了防止多次发送占用资源,TCP协议有可能将它们合并成一个TCP段发送,在目的地再还原成多个数据,这个过程叫做粘包。所以粘包就是将多个数据合并成一个TCP段发送。

TCP Segment,下面是一个TCP段的格式:

image.png

TCP拆包和粘包的作用是什么
1、Source Port 、Destination Port 描述的是发送端口号和目标端口号,代表发送数据的应用程序和接收数据的应用程序

2、Sequence Number和Acknowledgment Number 是保证稳定性的关键因素,

3、Data Offset是一个偏移量,TCP Header部分的长度是可变的,因此需要一个数值描述数据是从哪个节点开始的。

4、Reserved是很多协议涉及都会保留的一个区域,方便后期的扩展。

5、URG/ACK/PSH/RST/SYN/FIN是标志位,用于描述TCP段的行为,也就是TCP封包的具体作用是干啥的。

5.1URG,代表一个紧急的操作,比如是远程用户操作的Ctrl+C,

5.2ACK,代表响应,所有的消息都必须有ACK,这是确保稳定性的一环。

5.3PSH,代表发送数据

5.4SYN,代表发送同步请求,申请握手

5.5FIN,代表结束请求,也是挥手。

以上这个5个标识位,每个占一个比特,可以混合使用,比如ACK+SYN可以同时为1,代表,同步请求和响应请求被合并了。

6、Window也是TCP保证稳定性并进行流量控制的工具,

7、Checksum 是校验和,用于校验 TCP 段有没有损坏

8、Urgent Pointer 指向最后一个紧急数据的序号(Sequence Number)。它存在的原因是:有时候紧急数据是连续的很多个段,所以需要提前告诉接收方进行准备。

9、Options 中存储了一些可选字段

10、Padding 存在的意义是因为 Options 的长度不固定,需要 Pading 进行对齐。

对于传输数据,稳定性要求数据无损的传输,也就是说拆包获得数据,又需要恢复到原来的样子,所以就要保证顺序行。这个主要是通过这两个值来保证。

image.png

TCP拆包和粘包的作用是什么
上图中,发送方发送了100个字节的数据,而接受说明到(Seq=100和Seq=0)两个封包,都是针对发送方(Seq=0)这个封包的。发送100个字节,所以接收到的ACK刚好是100,说明(Seq=0和Seq100)这两个封包是针对接收到第100个字节数据后,发送回来的。这样来确定顺序。对于字节数是200的数据,返回的ACK也是200,所以这个就排列到ACK=300,的前面。而对于字节数是500的字节的数据,返回的ACK应该也是500,所以他排在ACK=300的后面。

所以这个顺序的排列是根据SequenceNumber 和AcknowledgementNumer 两个值共同决定的。

SequenceNumber 和Acknowledgement Number

在TCP协议中的设计当中,数据被拆分成很多个部分,部分增加了协议头。合并成一个TCP段,进行传输,这个过程,叫做拆包。这些TCP段经过复杂的网络结构,由底层的IP协议,负责传输到目的地,然后进行重组。

总结,TCP拆包的作用是将任务拆分处理,降低整体任务出错的概率,以及减小底层网络处理的压力。拆包过程需要保证数据经过网络的传输,又能恢复到原始的顺序。这中间,需要数学提供保证顺序的理论依据。TCP利用(发送字节数和接收字节数)的唯一性来确定封包之间的顺序。粘包是为了防止数据量过小,导致大量的传输,而将多个TCP段合并成一个发送。

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
相关文章
|
6月前
|
网络协议
解决TCP粘包问题
解决TCP粘包问题
|
移动开发 网络协议 算法
TCP中的粘包、拆包问题产生原因及解决方法
TCP中的粘包、拆包问题产生原因及解决方法
886 0
TCP中的粘包、拆包问题产生原因及解决方法
|
6月前
|
XML 缓存 网络协议
面试题:TCP的粘包和拆包
面试题:TCP的粘包和拆包
55 1
|
缓存 网络协议 算法
TCP粘包、拆包原因与解决方案
TCP粘包、拆包原因与解决方案
236 0
|
存储 消息中间件 缓存
计网 - TCP 的封包格式:TCP 为什么要粘包和拆包?
计网 - TCP 的封包格式:TCP 为什么要粘包和拆包?
129 0
|
网络协议 算法
第 9 章 TCP 粘包和拆包及解决方案
第 9 章 TCP 粘包和拆包及解决方案
221 0
|
网络协议 图形学
Socket TCP协议解决粘包、半包问题的三种解决方案
Socket TCP协议解决粘包、半包问题的三种解决方案
319 2
Socket TCP协议解决粘包、半包问题的三种解决方案
|
移动开发 网络协议 Java
TCP 粘包/拆包问题
《基础系列》
160 0
TCP 粘包/拆包问题
|
移动开发 网络协议
TCP的粘包拆包问题+解决方案
TCP的粘包拆包问题+解决方案
158 0
TCP的粘包拆包问题+解决方案
|
移动开发 网络协议
【Netty】TCP粘包和拆包
前面已经基本上讲解完了Netty的主要内容,现在来学习Netty中的一些可能存在的问题,如TCP粘包和拆包。
146 0
【Netty】TCP粘包和拆包