10.python网络编程（解决粘包问题 part 2）-阿里云开发者社区

10.python网络编程（解决粘包问题 part 2）

2017-11-15 1324

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一.什么时候会产生粘包现象。

只有在使用tcp协议的情况下才会产生粘包现象！udp协议永远不会！

发送端可以1k1k的把数据发送出去，接收端，可以2k2k的的去接收数据，一次可能会接收3k，也有可能1次接收6k。

TCP协议是面向流的协议，这也是容易出现粘包问题的原因。而UDP是面向消息的协议，每个UDP段都是一条消息，应用程序必须以消息为单位提取数据，不能一次提取任意字节的数据，这一点和TCP是很不同的。怎样定义消息呢？可以认为对方一次性write/send的数据为一个消息，需要明白的是当对方send一条信息的时候，无论底层怎样分段分片，TCP协议层会把构成整条消息的数据段排序完成后才呈现在内核缓冲区。

例如基于tcp的套接字客户端往服务端上传文件，发送时文件内容是按照一段一段的字节流发送的，在接收方看了，根本不知道该文件的字节流从何处开始，在何处结束！！！

其实说的再简单一些。

所谓粘包问题主要还是因为接收方不知道消息之间的界限，不知道一次性提取多少字节的数据所造成的。

！！此外，发送方引起的粘包是由TCP协议本身造成的，TCP为提高传输效率，发送方往往要收集到足够多的数据后才发送一个TCP段。若连续几次需要send的数据都很少，通常TCP会根据优化算法把这些数据合成一个TCP段后一次发送出去，这样接收方就收到了粘包数据。！！

TCP（transport control protocol，传输控制协议）是面向连接的，面向流的，提供高可靠性服务。收发两端（客户端和服务器端）都要有一一成对的socket，因此，发送端为了将多个发往接收端的包，更有效的发到对方，使用了优化方法（Nagle算法），将多次间隔较小且数据量小的数据，合并成一个大的数据块，然后进行封包。这样，接收端，就难于分辨出来了，必须提供科学的拆包机制。即面向流的通信是无消息保护边界的。

UDP（user datagram protocol，用户数据报协议）是无连接的，面向消息的，提供高效率服务。不会使用块的合并优化算法，, 由于UDP支持的是一对多的模式，所以接收端的skbuff(套接字缓冲区）采用了链式结构来记录每一个到达的UDP包，在每个UDP包中就有了消息头（消息来源地址，端口等信息），这样，对于接收端来说，就容易进行区分处理了。即面向消息的通信是有消息保护边界的。

udp的recvfrom是阻塞的，一个recvfrom(x)必须对一个一个sendinto(y),收完了x个字节的数据就算完成,若是y>x数据就丢失，这意味着udp根本不会粘包，但是会丢数据，不可靠

tcp的协议数据不会丢，没有收完包，下次接收，会继续上次继续接收，己端总是在收到ack时才会清除缓冲区内容。数据是可靠的，但是会粘包。

二、细说在tcp通信下产生粘包的两种情况：

发送端需要等缓冲区满才发送出去，造成粘包（发送数据时间间隔很短，数据了很小，会合到一起，产生粘包）。

另一种情况，就是，当发送端缓冲区的长度大于网卡的MTU时，tcp会将这次发送的数据拆成几个数据包发送出去。

补充说明：为什么说tcp连接可靠？

tcp在数据传输时，发送端先把数据发送到自己的缓存中，然后协议控制将缓存中的数据发往对端，对端返回一个ack=1，发送端则清理缓存中的数据，对端返回ack=0，则重新发送数据，所以tcp是可靠的

而udp发送数据，对端是不会返回确认信息的，因此不可靠。

三、如何解决粘包问题？

我们可以通过自定义报头的方式来解决粘包问题。

为字节流加上自定义固定长度报头，报头中包含字节流长度，然后一次send到对端，对端在接收时，先从缓存中取出定长的报头，然后再取真实数据。

说道自定义报头，就不得不提到一个名为struct模块，这个模块的主要作用就是，把一个类型，如数字，转成固定长度的bytes。（为什么要用这个模块？用这个模块是为了让报头长度固定，当报头长度固定后，就可以分辨出数据流中的报头和真实数据的分界了。）

关于struct模块的详细用法请参考：

http://www.cnblogs.com/coser/archive/2011/12/17/2291160.html

制作报头大概流程演示：

import json,struct

#假设通过客户端上传1T:1073741824000的文件a.txt

#为避免粘包,必须自定制报头

header={'file_size':1073741824000,'file_name':'/a/b/c/d/e/a.txt','md5':'8f6fbf8347faa4924a76856701edb0f3'} #1T数据,文件路径和md5值

#为了该报头能传送,需要序列化并且转为bytes

head_bytes=bytes(json.dumps(header),encoding='utf-8') #序列化并转成bytes,用于传输

#为了让客户端知道报头的长度,用struck将报头长度这个数字转成固定长度:4个字节

head_len_bytes=struct.pack('i',len(head_bytes)) #这4个字节里只包含了一个数字,该数字是报头的长度

#客户端开始发送

conn.send(head_len_bytes) #先发报头的长度,4个bytes

conn.send(head_bytes) #再发报头的字节格式

conn.sendall(文件内容) #然后发真实内容的字节格式

#服务端开始接收

head_len_bytes=s.recv(4) #先收报头4个bytes,得到报头长度的字节格式

x=struct.unpack('i',head_len_bytes)[0] #提取报头的长度

head_bytes=s.recv(x) #按照报头长度x,收取报头的bytes格式

header=json.loads(json.dumps(header)) #提取报头

#最后根据报头的内容提取真实的数据,比如

real_data_len=s.recv(header['file_size'])

s.recv(real_data_len)

粘包的解决思路：

我们可以把报头做成字典，字典里包含将要发送的真实数据的详细信息，然后json序列化，然后用struck将序列化后的数据长度打包成4个字节（4个自己足够用了）

发送时：

先发报头长度。

再编码报头内容然后发送。

最后发真实内容。

接收时：

先收报头长度，用struct取出来。

根据取出的长度收取报头内容，然后解码，反序列化。

从反序列化的结果中取出待取数据的详细信息，然后去取真实的数据内容。

下面是以python2.7版本作为示范的示例，做一个文件的上传功能，客户端可以将文件发送给服务端。

服务端代码：

#!/usr/bin/python2.7

# -*- coding:utf-8 -*-

import socket

import json

import struct

import os

class Mytcpserver(object):

sockt_family = socket.AF_INET

socket_type = socket.SOCK_STREAM

allow_reuse_addr = False

max_trans_size = 8192

coding = 'utf-8'

tcp_queue_size = 5

upload_dir_name = 'upload_file'

def __init__(self,server_address,bind_and_active = True):

self.server_address = server_address

self.socket = socket.socket(self.sockt_family,self.socket_type)

if bind_and_active:

try:

self.server_bind()

self.server_active()

except Exception:

self.server_close()

raise

def server_bind(self):

if self.allow_reuse_addr:

self.socket.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)

self.socket.bind(self.server_address)

self.server_address = self.socket.getsockname() #增加一个没啥卵用的功能,获取刚刚绑定的地址.

def server_active(self):

self.socket.listen(self.tcp_queue_size)

def server_close(self):

self.socket.close()

def get_request(self):

return self.socket.accept()

def close_request(self):

return self.socket.close()

def run(self):

while True:

self.conn,self.client_ip = self.get_request()

print self.client_ip

while True:

try:

head_struct = self.conn.recv(4) #用来接收报头

if not head_struct:

break

head_len = struct.unpack('i',head_struct)[0] #解析出来的报头长度

head_json = self.conn.recv(head_len).decode(self.coding) #接收报头内容

head_dict = json.loads(head_json) #将json报头转换为字典

print head_dict

cmd = head_dict['cmd']

if hasattr(self,cmd):

func = getattr(self,cmd)

func(head_dict)

except Exception:

break

def put(self,args):

upload_file_path = os.path.normpath(os.path.join(self.upload_dir_name,args['file_name']))

file_size = args["file_size"]

recv_size = 0

print "------>"+upload_file_path

with open(upload_file_path,'wb+') as f:

while recv_size < file_size:

recv_data = self.conn.recv(self.max_trans_size)

f.write(recv_data)

recv_size+=len(recv_data)

print "recvsize:%s filesize:%s" %(recv_size,file_size)

tcp_server_1 = Mytcpserver(('10.39.0.100',8888))

tcp_server_1.run()

客户端代码：

#!/usr/bin/python2.7

# -*- coding:utf-8 -*-

import socket

import json

import struct

import os

class Mytcpclient(object):

sockt_family = socket.AF_INET

socket_type = socket.SOCK_STREAM

allow_reuse_addr = False

max_trans_size = 8192

coding = 'utf-8'

tcp_queue_size = 5

def __init__(self,server_address,connect = True):

self.server_address = server_address

self.socket = socket.socket(self.sockt_family,self.socket_type)

if connect:

try:

self.client_connect()

except:

self.client_close()

raise

def client_connect(self):

self.socket.connect(self.server_address)

def client_close(self):

self.socket.close()

def run(self):

while True:

user_input = raw_input(">>").strip()

if not user_input:

continue

cmd = user_input.split()[0]

if hasattr(self,cmd):

func = getattr(self,cmd)

func(user_input.split())

def put(self,args):

cmd = args[0]

filename = args[1]

if not os.path.isfile(filename):

print "file is not exists!!"

return None

else:

filesize = os.path.getsize(filename)

head_dic = {'cmd':cmd,'file_name':os.path.basename(filename),'file_size':filesize}

print head_dic

head_json = json.dumps(head_dic).encode("utf-8")

head_struct_size = struct.pack('i',len(head_json)).encode("utf-8") #准备发送的报头大小

self.socket.send(head_struct_size) #发送报头大小

self.socket.send(head_json) #发送报头

send_size = 0

with open(filename,'rb') as f:

for line in f:

self.socket.send(line)

send_size+=len(line)

print send_size

else:

print "file upload success!!"

client = Mytcpclient(('10.39.0.100',8888))

client.run()

本文转自苏浩智 51CTO博客，原文链接：http://blog.51cto.com/suhaozhi/1923431，如需转载请自行联系原作者

10.python网络编程（解决粘包问题 part 2）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

10.python网络编程（解决粘包问题 part 2）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像