前言
本篇文章将引入一个重要的知识:TCP的粘包问题,在发送数据的时候可能会出现粘包的问题,很多初学者应该都不知道什么是粘包,那么本篇文章将讲解什么是粘包,又怎么样解决粘包,这将是一个重点问题,希望大家好好理解。
下面我们先做一个小实验。
一、一次发送多个数据实验
改写之前编写的client程序:
#include <unistd.h> #include <stdio.h> #include <sys/types.h> /* See NOTES */ #include <sys/socket.h> #include <strings.h> #include <arpa/inet.h> #include <string.h> int main(int argc, char **argv) { int sockfd = 0; int n = 0; char* send_buf; struct sockaddr_in servaddr; if(argc != 2) { printf("parameter is err\n"); } if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0) { printf(" socket is err\n "); } bzero(&servaddr, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_port = htons(8888); if(inet_pton(AF_INET, argv[1], &servaddr.sin_addr) <= 0) { printf("inet_pton is err\n"); } if(connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0) { printf("connect is err\n"); } send(sockfd, "Hello", 5, 0); send(sockfd, "World", 5, 0); send(sockfd, "Client", 6, 0); // while (1) // { // printf("input :\n"); // scanf("%s", send_buf); // send(sockfd, send_buf, strlen(send_buf) + 1, 0); // printf("\n"); // } if(n < 0) { printf("read err\n"); } close(sockfd); return 0; }
这里使用send函数连续发送三个字符串给服务端,正常我们认为输出的结果应该是:
Hello
World
Client
因为我们是分开三次发送的,但是结果却不是这样的。
运行服务端输出结果如下:
输出的结果是这三个字符串都连在一起了,这就是我们说的粘包问题,当一次性发送多个字符串时就会发生这样的问题。
二、导致问题的原因
在网络传输中,TCP 协议传输的是数据流,而非数据包。因此,服务端不知道发送方发送的消息的具体边界。因为在数据发送过程中,TCP 会对较小的数据包进行合并,从而减少发送频率和网络流量,这就可能导致数据在接收方处出现黏包的情况。
三、解决方案之一:延时发送
每次发送过后都延时一段时间,这样处理服务端可以接收到我们想要的结果。
但是这样的处理有一个很明显的缺点就是大量使用了延时函数,这样处理会降低程序的效率。所以这个处理方法是不太可行的。
那么为什么使用延时函数后服务端可以打印出我们想要的结果呢?
使用了延时函数这样能够使数据缓冲区有时间将数据发送给接收方并进行处理,避免了第二条或第三条消息被阻塞或黏包的情况。
send(sockfd, "Hello", 5, 0); sleep(1); send(sockfd, "World", 5, 0); sleep(1); send(sockfd, "Client", 6, 0); sleep(1);
四、知识点补充发送缓冲区和接收缓冲区
初学者会有一个很大的误区。会认为客户端和服务端之前的数据传递是直接的,其实这是不正确的,他们之间的数据传递需要通过缓冲区来实现。
发送缓冲区是一个缓存区,它存放着客户端或服务端将要发送的数据。
接收缓冲区用来存放接收到的数据,接收端从接收缓冲区中取出数据,并将它们合并成完整的数据,再提供给上层应用程序使用。
当发送数据时数据会先发送到发送缓冲区中,接收数据时也需要从接收缓冲区中接收数据。并不是直接发送数据到对端的。
在网络通信中,发送方应用程序把要发送的数据存储在发送缓冲区中,操作系统会负责将缓冲区中的数据封装成网络数据包,并通过网络将数据包发送给接收方。
这就是为什么连续发送三次数据读取出来的时候数据是粘连在一起的原因了。发送数据的速度是非常快的,发送的数据都会保存在发送缓冲区当中,操作系统不知道这是发送的三次数据,他只负责运输数据,所以他将这三次的数据当成一次数据全部发送过去了。
使用了延时函数后操作系统有足够时间处理一次数据的接收和发送,所以这样不会出现粘包问题。
五、解决方法
使用自定义的协议,规定好数据包的格式和数据长度,以及数据包之间的分隔符,从而在接收端可以正确解析数据包,避免数据粘包等问题。
解决这个问题可以使用指定通信协议的方法来解决,规定数据的首部尾部等,这样对端根据制定的通信协议就能够知道是发送了几次数据了,并将正确的所需要的数据解析出来。
总结
本篇文章是非常重要的,希望大家好好吸收和消化,理解TCP发送数据的工程中为什么会出现粘包问题。
后续的文章将会讲解如何指定通信协议。