Linux网络编程TCP粘包问题解析及解决方法

本文涉及的产品
云解析 DNS,旗舰版 1个月
云解析DNS,个人版 1个月
全局流量管理 GTM,标准版 1个月
简介: Linux网络编程TCP粘包问题解析及解决方法

前言

本篇文章将引入一个重要的知识:TCP的粘包问题,在发送数据的时候可能会出现粘包的问题,很多初学者应该都不知道什么是粘包,那么本篇文章将讲解什么是粘包,又怎么样解决粘包,这将是一个重点问题,希望大家好好理解。

下面我们先做一个小实验。


一、一次发送多个数据实验

改写之前编写的client程序:

#include <unistd.h>
#include <stdio.h>
#include <sys/types.h>          /* See NOTES */
#include <sys/socket.h>
#include <strings.h>
#include <arpa/inet.h>
#include <string.h>
int main(int argc, char **argv)
{
    int sockfd = 0;
    int n = 0;
    char* send_buf;
    struct sockaddr_in servaddr;
    if(argc != 2)
    {
        printf("parameter is err\n");
    }
    if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0)
    {
        printf(" socket is err\n ");
    }
    bzero(&servaddr, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(8888);
    if(inet_pton(AF_INET, argv[1], &servaddr.sin_addr) <= 0)
    {
        printf("inet_pton is err\n");
    }
    if(connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0)
    {
        printf("connect is err\n");
    }
    send(sockfd, "Hello", 5, 0);
    send(sockfd, "World", 5, 0);
    send(sockfd, "Client", 6, 0);
    // while (1)
    // {
    //     printf("input :\n");
    //     scanf("%s", send_buf);
    //     send(sockfd, send_buf, strlen(send_buf) + 1, 0); 
    //     printf("\n");
    // }
    if(n < 0)
    {
        printf("read err\n");
    }
    close(sockfd);
    return 0;    
}

这里使用send函数连续发送三个字符串给服务端,正常我们认为输出的结果应该是:

Hello

World

Client

因为我们是分开三次发送的,但是结果却不是这样的。

运行服务端输出结果如下:

caa60073c93c41e8a50bc651f3873939.png

输出的结果是这三个字符串都连在一起了,这就是我们说的粘包问题,当一次性发送多个字符串时就会发生这样的问题。


二、导致问题的原因

在网络传输中,TCP 协议传输的是数据流,而非数据包。因此,服务端不知道发送方发送的消息的具体边界。因为在数据发送过程中,TCP 会对较小的数据包进行合并,从而减少发送频率和网络流量,这就可能导致数据在接收方处出现黏包的情况。


三、解决方案之一:延时发送

每次发送过后都延时一段时间,这样处理服务端可以接收到我们想要的结果。

但是这样的处理有一个很明显的缺点就是大量使用了延时函数,这样处理会降低程序的效率。所以这个处理方法是不太可行的。

那么为什么使用延时函数后服务端可以打印出我们想要的结果呢?

使用了延时函数这样能够使数据缓冲区有时间将数据发送给接收方并进行处理,避免了第二条或第三条消息被阻塞或黏包的情况。

send(sockfd, "Hello", 5, 0);
sleep(1);
send(sockfd, "World", 5, 0);
sleep(1);
send(sockfd, "Client", 6, 0);
sleep(1);

四、知识点补充发送缓冲区和接收缓冲区

初学者会有一个很大的误区。会认为客户端和服务端之前的数据传递是直接的,其实这是不正确的,他们之间的数据传递需要通过缓冲区来实现。

788bcabbdd0c459c98b00732a68e750c.png

发送缓冲区是一个缓存区,它存放着客户端或服务端将要发送的数据。


接收缓冲区用来存放接收到的数据,接收端从接收缓冲区中取出数据,并将它们合并成完整的数据,再提供给上层应用程序使用。


当发送数据时数据会先发送到发送缓冲区中,接收数据时也需要从接收缓冲区中接收数据。并不是直接发送数据到对端的。


在网络通信中,发送方应用程序把要发送的数据存储在发送缓冲区中,操作系统会负责将缓冲区中的数据封装成网络数据包,并通过网络将数据包发送给接收方。


这就是为什么连续发送三次数据读取出来的时候数据是粘连在一起的原因了。发送数据的速度是非常快的,发送的数据都会保存在发送缓冲区当中,操作系统不知道这是发送的三次数据,他只负责运输数据,所以他将这三次的数据当成一次数据全部发送过去了。


使用了延时函数后操作系统有足够时间处理一次数据的接收和发送,所以这样不会出现粘包问题。


五、解决方法

使用自定义的协议,规定好数据包的格式和数据长度,以及数据包之间的分隔符,从而在接收端可以正确解析数据包,避免数据粘包等问题。


解决这个问题可以使用指定通信协议的方法来解决,规定数据的首部尾部等,这样对端根据制定的通信协议就能够知道是发送了几次数据了,并将正确的所需要的数据解析出来。


总结

本篇文章是非常重要的,希望大家好好吸收和消化,理解TCP发送数据的工程中为什么会出现粘包问题。

后续的文章将会讲解如何指定通信协议。


相关文章
|
2天前
|
Linux 数据处理 开发者
深入解析Linux中的paste命令:数据处理与分析的得力助手
`paste`命令在Linux中是数据处理的利器,它按列拼接多个文件内容,支持自定义分隔符和从标准输入读取。例如,合并`file1.txt`和`file2.txt`,使用`paste file1.txt file2.txt`,默认以制表符分隔;若要使用逗号分隔,可运行`paste -d &#39;,&#39; file1.txt file2.txt`。当文件行数不同时,较短文件后会填充空白行。结合管道符与其他命令使用,如`cat file1.txt | paste -s`,可按行合并内容。注意文件大小可能影响性能。
|
4天前
|
安全 物联网 Linux
学习Linux对网络安全的重要性
**学习Linux对网络安全至关重要:** 1. 开源操作系统广泛应用于服务器、网络设备,掌握Linux是安全专家必备技能。 2. Linux内置安全特性,如最小权限和防火墙,加上丰富的安全工具,提供强大保障。 3. 可定制性允许灵活配置,满足安全需求,开源社区提供持续更新和教育资源。 4. 学习Linux能提升攻防能力,用于系统加固和渗透测试,适应跨平台安全场景。 5. 随着云计算和物联网发展,Linux在网络安全中的角色日益关键。
29 3
|
2天前
|
存储 安全 Linux
深入解析Linux命令p11-kit:PKCS#11模块的协调器
**p11-kit详解:连接PKCS#11模块的桥梁** p11-kit是Linux下管理PKCS#11加密设备的库,它提供统一接口,简化与智能卡、HSM等的交互。用于密码学开发、系统集成及云服务,支持动态加载模块,通过API简化编程。安装时注意依赖,选择合适方式,关注版本兼容性,并通过文档和测试确保稳定。代码示例展示如何加载和卸载PKCS#11模块。
|
2天前
|
NoSQL Linux 程序员
Linux objdump命令:深入解析与实战应用
`objdump`是Linux下的反汇编工具,用于将二进制文件转换为汇编代码,便于理解程序底层。它可以反汇编目标文件、可执行文件和库,支持多种参数,如显示符号表(-t)、反汇编代码(-d)、源代码与汇编混合视图(-S)。在实践中,结合-g编译选项和特定段(-j)反汇编,能辅助调试和分析。使用时注意包含调试信息,选择适当参数,并与其他工具(如gdb)配合使用。
|
4天前
|
Ubuntu Unix Linux
Linux 用户使用sudo时 显示xxx is not in the sudoers file.This incident will be reported.的解决方法
Linux 用户使用sudo时 显示xxx is not in the sudoers file.This incident will be reported.的解决方法
11 1
|
5天前
|
存储 安全 Linux
深入解析Linux命令modutil:数据处理的得力助手
`modutil`是管理PKCS#11及HSM模块的工具,用于安全数据处理。它跨平台且具丰富选项,如 `-add`、`-remove`、`-list` 和 `-initToken`。示例命令是 `modutil -add &quot;MyHSM&quot; -libfile /path/to/hsm_library.so -slot 0 -dbdir /path/to/pkcs11_db`,用于添加模块。使用时注意权限,备份数据,阅读文档并谨慎操作,可与其他工具如`pkcs11-tool`结合使用。
|
5天前
|
Linux 数据处理
探索Linux中的namei命令:文件路径解析的利器
`namei`是Linux工具,解析文件路径展示每个组件详情,包括类型、权限、属主等。它递归从根目录开始,帮助理解文件系统结构,尤其处理符号链接和挂载点。使用 `-l` 选项提供长格式输出, `-m` 以挂载点显示, `-x` 显示调试信息。示例用法如解析`/home/user/documents/report.txt`路径。注意权限、路径正确性及符号链接影响。可与其他命令结合使用。
|
19小时前
|
Linux 网络安全 数据处理
探索Linux命令ping:网络诊断的得力助手
`ping`是Linux下的网络诊断命令,基于ICMP协议,用于测试主机连通性和测量延迟。它发送Echo请求并等待响应,显示统计信息如发送/接收包数、丢失率和平均延迟。命令支持配置参数,如`-c`指定发送次数,`-i`设置间隔,`-s`定义包大小。示例包括测试到Google的连通性及定制化测试。注意防火墙可能阻止ICMP流量,排查网络问题时可与其他工具结合使用。
|
2天前
|
Linux 编译器 数据处理
探索Linux命令之nm:解析二进制文件的神器
`nm`命令是Linux下分析二进制文件的工具,显示符号表中的函数、变量等信息及它们的地址和类型。它帮助理解程序结构、调试和优化,支持不同符号类型、输出选项和过滤。常用参数如`-a`显示所有符号,`-t f`列出定义的函数。在实际应用中,可以结合其他工具如`objdump`、`readelf`进行更深入的分析,并注意备份原始文件。
|
4天前
|
Ubuntu Unix Linux
Linux 用户使用sudo时 显示xxx is not in the sudoers file.This incident will be reported.的解决方法
Linux 用户使用sudo时 显示xxx is not in the sudoers file.This incident will be reported.的解决方法
12 0

热门文章

最新文章