TCP(Transmission Control Protocol )传输控制协议,是目前传输层应用最广泛的协议,当然这跟它的特性息息相关。
一、它的主要特性有:
1、可靠,面向连接
2、工作在传输层面向连接协议
3、全双工协议
4、半关闭(单方关闭)
5、错误检查
每个数据包有编号,对方收到之后,会告诉发送方收到了,回给对方说我下次希望收到第n+1个包,假如发送了三个包,但是接受方只收到了两个,会说下次希望收到第三个包,那么就实现了错误检查和重传
6、将数据打包成段,排序
即标记序列号,有时候数据太大,会分成多个包,就需要有序列号,方便接收方组装
7、确认机制
8、数据恢复,重传
有时候传输会有丢包现象,那么发送方会从接受方的回应包中知道丢的包是什么,就会重传。
9、流量控制,滑动窗口
10、拥塞控制,慢启动(翻倍递进)和拥塞避免算法
二、TCP包头(最大60字节,固定首部20字节,选项40字节)
▼ 源端口、目标端口:计算机上的进程要和其他进程通信是要通过计算机端口的,而一个计算机端口某个时刻只能被一个进程占用,所以通过指定源端口和目标端口,就可以知道是哪两个进程需要通信。源端口、目标端口是用16位表示的,可推算计算机的端口个数为2^16个。
服务器端的端口号是固定的,客户端的端口是随机生成的。在Windows的命令行可以使用netstat -no 查看协议类型、本地地址、外部地址、状态、端口号等。在linux中使用netstat -ntp
端口是计算机应用程序对应的端口,端口即相当于应用程序地址的作用。
▼ 序号(Sequence number):表示本报文段所发送数据的第一个字节的编号。在TCP连接中所传送的字节流的每一个字节都会按顺序编号。由于序列号由32位表示,所以每2^32个字节,就会出现序列号回绕,再次从0开始
▼ 确认号(Acknowledgment number):表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。也就是告诉发送方:我希望你下次发送的数据的第一个字节数据的编号是这个确认号。即达到确认目的
▼ 数据偏移:表示TCP报文段的首部长度,共4位,由于TCP首部包含一个长度可变的选项部分,需要指定这个TCP报文段到底有多长。它指出TCP报文段的数据起始处距离TCP报文段的起始处有多远。该字段的单位是32位(即4个字节为计算单位),4位二进制最大表示是15,所以数据偏移(也就是TCP首部)最大60字节
▼保留位:占6位,用不到。
▼ URG:表示本报文段中发送的数据是否包含紧急数据,占一位。后面的紧急指针字段(urgent pointer)只有当URG=1时才有效
▼ ACK:表示是否前面的确认号字段是否有效。ACK=1,表示有效。只有当ACK=1时,前面的确认号字段才有效。
TCP规定,连接建立后,ACK必须为1,带ACK标志的TCP报文段称为确认报文段
▼ PSH:提示接收端应用程序应该立即从TCP接收缓冲区中读走数据,为接收后续数据腾出空间。如果为1,则表示对方应当立即把数据提交给上层应用,而不是缓存起来,如果应用程序不将接收到的数据读走,就会一直停留在TCP接收缓冲区中
▼ RST:如果收到一个RST=1的报文,说明与主机的连接出现了严重错误(如主机崩溃),必须释放连接,然后再重新建立连接。或者说明上次发送给主机的数据有问题,主机拒绝响应,带RST标志的TCP报文段称为复位报文段
▼ SYN:在建立连接时使用,用来同步序号。当SYN=1,ACK=0时,表示这是一个请求建立连接的报文段;当SYN=1,ACK=1时,表示对方同意建立连接。SYN=1,说明这是一个请求建立连接或同意建立连接的报文。只有在前两次握手中SYN才置为1,带SYN标志的TCP报文段称为同步报文段
▼ FIN:表示通知对方本端要关闭连接了,标记数据是否发送完毕。如果FIN=1,即告诉对方:“我的数据已经发送完毕,你可以释放连接了”,带FIN标志的TCP报文段称为结束报文段
▼ 窗口大小:占16位,表示现在充许对方发送的数据量,也就是告诉对方,从本报文段的确认号开始允许对方发送的数据量
▼ 校验和(16位):提供额外的可靠性
▼ 紧急指针(16位):标记紧急数据在数据字段中的位置
▼ 选项部分(24位):长度可变,其最大长度可根据TCP首部长度进行推算。TCP首部长度用4位表示,选项部分最长为:(2^4-1)*4-20=40字节
▼ 填充(8位):用不到
三、常见选项
(1)最大报文段长度:MaxiumSegment Size,MSS
指明自己期望对方发送TCP报文段时那个数据字段的长度。默认是536字节。数据字段的长度加上TCP首部的长度才等于整个TCP报文段的长度。MSS不宜设的太大也不宜设的太小。若选择太小,极端情况下,TCP报文段只含有1字节数据,在IP层传输的数据报的开销至少有40字节(包括TCP报文段的首部和IP数据报的首部)。这样,网络的利用率就不会超过1/41。若TCP报文段非常长,那么在IP层传输时就有可能要分解成多个短数据报片。在终点要把收到的各个短数据报片装配成原来的TCP报文段。当传输出错时还要进行重传,这些也都会使开销增大。因此MSS应尽可能大,只要在IP层传输时不需要再分片就行。在连接建立过程中,双方都把自己能够支持的MSS接入这一字段。MSS只出现在SYN报文中。即:MSS出现在SYN=1的报文段中
(2)窗口扩大:Windows Scaling
由于TCP首部的窗口大小字段长度是16位,所以其表示的最大数是65535。但是随着时延和带宽比较大的通信产生(如卫星通信),需要更大的窗口来满足性能和吞吐率,所以产生了这个窗口扩大选项
(3)时间戳:Timestamps
可以用来计算RTT(往返时间),发送方发送TCP报文时,把当前的时间值放入时间戳字段,接收方收到后发送确认报文时,把这个时间戳字段的值复制到确认报文中,当发送方收到确认报文后即可计算出RTT。也可以用来防止回绕序号PAWS,也可以说可以用来区分相同序列号的不同报文。因为序列号用32为表示,每2^32个序列号就会产生回绕,那么使用时间戳字段就很容易区分相同序列号的不同报文
(4)TCP协议端口号
配置文件(范围的定义):
/proc/sys/net/ipv4/ip_local_port_range
传输层通过port号,确定应用层协议
tcp:传输控制协议,面向连接,通信前需要建立虚拟链路,结束后拆除链路(0-65535 即2^16-1)
udp:用户数据包协议,无连接,不可靠(0-65535)
IANA:互联网数字分配机构(负责域名,数字资源,协议分配)
0-1023:系统端口或特权端口(仅管理员可用),是众所周知的端口,永久的分配给固定的系统应用使用,22/tcp(ssh), 80/tcp(http), 443/tcp(https)
1024-49151:用户端口或注册端口,但要求并不严格,分配给程序注册为某应用使用,1433/tcp(SqlServer),1521/tcp(oracle),3306/tcp(mysql),11211/tcp/udp(memcached)
49152-65535:动态端口或私有端口,客户端程序随机使用的端口
四、TCP的三次握手/四次挥手
1、TCP三次握手过程
(1)过程:
Client-------------------------service
主动打开被动打开
1-----------SYN=1,seq=x------------->
2<---SYN=1,ACk=1,seq=y,ack=x+1--------
3-------ACK=1,seq=x+1,ack=y+1-------->
<----------------数据---------------->
(2)状态切换
客户端:
Closed--> SYN-SENT --> ESTAB-LISHED
关闭 同步已发送 已建立连接
客户端本来处于关闭状态,在发送完连接请求之后进入SYN-SENT状态,在接收到服务器端的确认信息然后回给对方确认信息之后,就进入ESTAB-LISHED状态,表示可以互相通信了。
服务器端:
Closed--> LISTEN --> SYN-RCVD --> ESTAB-LISHED
关闭 监听 同步收到 已建立连接
一般服务器端直接就处于LISTEN监听状态,在收到客户端连接请求并且回给客户端确认信息之后就处于SYN-RCVD 状态,在收到客户端确认信息之后就处于ESTAB-LISHED状态,表示可以互相通信了。
2、TCP四次分手过程
(1)过程:
Client--------------------------Server
主动关闭被动关闭
1----------- FIN=1,seq=u ----------->
2<----- ACK=1,seq=v,ack=u+1 ---------
3<----- FIN=1,ACK=1,seq=w,ack=u+1 ----
4------ ACK=1,seq=u+1,ack=w+1 -------
(2)状态切换:
客户端:
ESTAB-LISHED --> FIN-WAIT-1 -- > FIN-WAIT-2 --> TIME-WAIT --> CLOSED
建立连接状态 终止等待1 终止等待2 时间等待 关闭
客户端本来处于ESTAB-LISHED建立连接状态,在给服务器端发送了请求断开后就进入FIN-WAIT-1状态,在接收到服务器端发来的确认包之后,就进入FIN-WAIT-2状态,之后在接收到服务器端发来的请求断开包之后立即给服务器端发送确认包,然后就进入TIME-WAIT状态(为了保证服务器端可以收到我的确认包),一般等待两分钟之后就进入CLOSED状态。
服务器端:
ESTAB-LISHED --> CLOSE-WAIT --> LAST-ACK --> CLOSED
建立连接状态 关闭等待 最后确认 关闭
服务器端本来处于ESTAB-LISHED建立连接状态,在接收到客户端的断开连接请求并给客户端发送确认包之后,进入CLOSE-WAIT状态,然后给客户端也发送断开连接请求,就进入LAST-ACK状态,在收到客户端的确认包之后进入CLOSED状态。
五、有限状态机FSM(Finite State Machine)
CLOSED 没有任何连接状态
LISTEN 侦听状态,等待来自远方TCP端口的连接请求
SYN-SENT 在发送连接请求后,等待对方确认
SYN-RECEIVED 在收到和发送一个连接请求后,等待对方确认
ESTABLISHED 代表传输连接建立,双方进入数据传送状态
FIN-WAIT-1 主动关闭,主机已发送关闭连接请求,等待对方确认
FIN-WAIT-2 主动关闭,主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求
TIME-WAIT 完成双向传输连接关闭,等待所有分组消失(查看timewait时间 :cat /proc/sys/net/ipv4/tcp_fin_timeout )
CLOSE-WAIT 被动关闭,收到对方发来的关闭连接请求,并已确认
LAST-ACK 被动关闭,等待最后一个关闭传输连接确认,并等待所有分组消失
CLOSING 双方同时尝试关闭传输连接,等待对方确认
六、TCP超时重传
异常网络状况下(开始出现超时或丢包),TCP控制数据传输以保证其承诺的可靠服务。TCP服务必须能够重传超时时间内未收到确认的TCP报文段。为此,TCP模块为每个TCP报文段都维护一个重传定时器,该定时器在TCP报文段第一次被发送时启动。如果超时时间内未收到接收方的应答,TCP模块将重传TCP报文段并重置定时器。至于下次重传的超时时间如何选择,以及最多执行多少次重传,就是TCP的重传策略与TCP超时重传相关的两个内核参数决定的:
/proc/sys/net/ipv4/tcp_retries1,指定在底层IP接管之前TCP最少执行的重传次数,默认值是3
/proc/sys/net/ipv4/tcp_retries,指定连接放弃前TCP最多可以执行的重传次数,默认值15(一般对应13~30min)
七、滑动窗口
A主机给服务端发送一些包,等待服务端的回应,当返回信息为ack=4时则表示,表示服务器说我窗口大小为三,目前只能接收3个包,请求你发第四个包。
八、拥塞控制
TCP为提高网络利用率,降低丢包率,并保证网络资源对每条数据流的公平性。即所谓的拥塞控制。当网络不好时就降低速度。
TCP拥塞控制的标准文档是RFC 5681,其中详细介绍了拥塞控制的四个部分:慢启动(slow start)、拥塞避免(congestion avoidance)、快速重传(fast retransmit)和快速恢复(fast recovery)。拥塞控制算法在Linux下有多种实现,比如reno算法、vegas算法和cubic算法等。 它们或者部分或者全部实现了上述四个部分
cat /proc/sys/net/ipv4/tcp_congestion_control 可以查看当前所使用的拥塞控制算法。
以上就是关于TCP的一些原理,希望能对大家有所帮助。