Python是一种广泛应用于数据处理和网络编程的语言。在与C语言或其他设备进行二进制通信时,Python需要使用一些专门的模块来转换数据格式。本文将介绍三个常用的模块:struct、array、ctypes,并从结构说明和性能分析两方面进行比较。
模块 |
结构说明 |
适用范围 |
struct |
提供了pack和unpack函数,可以将Python数据转换为字节流,或者将字节流转换为Python数据。它适合处理简单的数据结构,如整数、浮点数、字符串等,但不支持复杂的数据结构,如指针、数组、结构体等。 |
适合处理简单且固定长度的数据 |
array |
提供了一个类似于列表的对象,可以存储一组相同类型的值,并且占用更少的内存空间。它适合处理一维数组,但不支持多维数组或其他复杂类型。 |
适合处理大量相同类型且长度可变的数据 |
ctypes |
提供了Structure类,可以直接定义与C语言中相同的结构体,并且支持指针、数组等复杂类型。它适合处理复杂的数据结构,并且可以方便地与动态链接库交互。 |
适合处理复杂且长度不定 |
从上图可以看出,在二进制通信中,
- struct模块有最高的效率,因为它直接使用Python内置 的C函数进行数据转换, 而不需要额外 的对象或内存分配 。它也支持缓冲区协议, 可以避免 数据拷贝。
- array模块有最低 的效率, 因为它需要创建一个数组对象, 并且每次转换 数据都需要调用方法或属性 。它也不支持缓冲区协议, 所以不能直接与动态链接库交互。
- ctypes模块 的效率介于struct和array之间, 因为它可以直接定义与C语言兼容 的数据类型, 并且支持缓冲区协议。 但是它也需要创建一些对象, 并且有一些额外 的开销。
综上所述,如果需要处理简单的数据结构,struct模块在二进制通信中有最高的效率。但是,如果需要处理复杂的数据结构,ctypes模块可能是一个更好的选择,因为它支持指针、数组等复杂类型。array模块适合处理一维数组,但在性能方面较低,不支持缓冲区协议,所以不能直接与动态链接库交互。
下面使用ctypes模块进行通信:
# 导入ctypes模块importctypes# 定义一个C语言中的结构体classData(ctypes.Structure): # 指定结构体的字段和类型_fields_= [ ("id", ctypes.c_int), ("name", ctypes.c_char*20), ("value", ctypes.c_float) ] # 创建一个Data数组,并赋值data_array= (Data*3)() data_array[0].id=1data_array[0].name=b"jack"data_array[0].value=3.14data_array[1].id=2data_array[1].name=b"rose"data_array[1].value=4.56data_array[2].id=3data_array[2].name=b"jack"data_array[2].value=7.89# 导入httpx模块和threading模块importhttpximportthreading# 代理服务器(产品官网 www.16yun.cn)proxyHost="t.16yun.cn"proxyPort="31111"# 代理验证信息proxyUser="16yun"proxyPass="16ip"proxyMeta="http://%(user)s:%(pass)s@%(host)s:%(port)s"% { "host": proxyHost, "port": proxyPort, "user": proxyUser, "pass": proxyPass, } # 设置 http和https访问都是用HTTP代理proxies= { "http://": proxyMeta, "https://": proxyMeta, } # 定义一个函数,用于发送POST请求,并接收响应内容defsend_request(data): # 将Data对象转换为字节流bytes_data=bytes(data) # 创建一个httpx客户端,并设置爬虫加强版代理IPclient=httpx.Client(proxies) # 发送POST请求,将字节流作为请求体,并设置超时时间为10秒钟response=client.post("http://www.16yun.cn/api", data=bytes_data, timeout=10) # 打印响应状态码和内容print(response.status_code) print(response.text) # 遍历Data数组中的每个元素,判断其name是否等于jack,如果是,则创建一个线程并执行send_request函数,并将该元素作为参数传递给函数;如果不是,则跳过该元素。fordataindata_array: ifdata.name==b"jack": thread=threading.Thread(target=send_request, args=(data,)) thread.start()
上述代码通过ctypes.Structure实现指针、数组的复杂类型,然后使用代理IP进行post,实现快速的二进制通信。