每周一个 Python 模块 | struct

简介: struct 模块包括用于在字节串和 Python 数据类型(如数字和字符串)之间进行转换的函数。

struct 模块包括用于在字节串和 Python 数据类型(如数字和字符串)之间进行转换的函数。


包装和拆包


Structs 支持将数据打包成字符串,并使用格式说明符从字符串中解压缩数据,格式说明符由表示数据类型的字符、可选计数和字节顺序指示符组成。有关支持的格式说明符的完整列表,请参阅标准库文档。

在此示例中,说明符调用整数或长整数值,双字节字符串和浮点数。格式说明符中的空格用作分隔类型指示符,并在编译格式时忽略。


import struct
import binascii
values = (1, 'ab'.encode('utf-8'), 2.7)
s = struct.Struct('I 2s f')
packed_data = s.pack(*values)
print('Original values:', values)
print('Format string  :', s.format)
print('Uses           :', s.size, 'bytes')
print('Packed Value   :', binascii.hexlify(packed_data))
# output
# Original values: (1, b'ab', 2.7)
# Format string  : b'I 2s f'
# Uses           : 12 bytes
# Packed Value   : b'0100000061620000cdcc2c40'
复制代码


该示例使用函数 binascii.hexlify() 将打包值转换为十六进制字节序列以进行打印。

unpack()从打包中提取数据。


import struct
import binascii
packed_data = binascii.unhexlify(b'0100000061620000cdcc2c40')
s = struct.Struct('I 2s f')
unpacked_data = s.unpack(packed_data)
print('Unpacked Values:', unpacked_data)
# output
# Unpacked Values: (1, b'ab', 2.700000047683716)
复制代码


将打包值传递给 unpack(),返回基本相同的值(注意浮点值的差异)。


字节顺序


默认情况下,使用本机 C 库的字节序对值进行编码 。通过在格式字符串中提供显式字节序指令,可以轻松覆盖该选项。


import struct
import binascii
values = (1, 'ab'.encode('utf-8'), 2.7)
print('Original values:', values)
endianness = [
    ('@', 'native, native'),
    ('=', 'native, standard'),
    ('<', 'little-endian'),
    ('>', 'big-endian'),
    ('!', 'network'),
]
for code, name in endianness:
    s = struct.Struct(code + ' I 2s f')
    packed_data = s.pack(*values)
    print()
    print('Format string  :', s.format, 'for', name)
    print('Uses           :', s.size, 'bytes')
    print('Packed Value   :', binascii.hexlify(packed_data))
    print('Unpacked Value :', s.unpack(packed_data))
# output
# Original values: (1, b'ab', 2.7)
# 
# Format string  : b'@ I 2s f' for native, native
# Uses           : 12 bytes
# Packed Value   : b'0100000061620000cdcc2c40'
# Unpacked Value : (1, b'ab', 2.700000047683716)
# 
# Format string  : b'= I 2s f' for native, standard
# Uses           : 10 bytes
# Packed Value   : b'010000006162cdcc2c40'
# Unpacked Value : (1, b'ab', 2.700000047683716)
# 
# Format string  : b'< I 2s f' for little-endian
# Uses           : 10 bytes
# Packed Value   : b'010000006162cdcc2c40'
# Unpacked Value : (1, b'ab', 2.700000047683716)
# 
# Format string  : b'> I 2s f' for big-endian
# Uses           : 10 bytes
# Packed Value   : b'000000016162402ccccd'
# Unpacked Value : (1, b'ab', 2.700000047683716)
# 
# Format string  : b'! I 2s f' for network
# Uses           : 10 bytes
# Packed Value   : b'000000016162402ccccd'
# Unpacked Value : (1, b'ab', 2.700000047683716)
复制代码


缓冲区


使用二进制打包数据通常用于对性能要求较高的场景或将数据传入和传出扩展模块。通过避免为每个打包结构分配新缓冲区,可以优化这些情况。pack_into()unpack_from()方法支持直接写入预先分配的缓冲区。


import array
import binascii
import ctypes
import struct
s = struct.Struct('I 2s f')
values = (1, 'ab'.encode('utf-8'), 2.7)
print('Original:', values)
print()
print('ctypes string buffer')
b = ctypes.create_string_buffer(s.size)
print('Before  :', binascii.hexlify(b.raw))
s.pack_into(b, 0, *values)
print('After   :', binascii.hexlify(b.raw))
print('Unpacked:', s.unpack_from(b, 0))
print()
print('array')
a = array.array('b', b'\0' * s.size)
print('Before  :', binascii.hexlify(a))
s.pack_into(a, 0, *values)
print('After   :', binascii.hexlify(a))
print('Unpacked:', s.unpack_from(a, 0))
# output
# Original: (1, b'ab', 2.7)
# 
# ctypes string buffer
# Before  : b'000000000000000000000000'
# After   : b'0100000061620000cdcc2c40'
# Unpacked: (1, b'ab', 2.700000047683716)
# 
# array
# Before  : b'000000000000000000000000'
# After   : b'0100000061620000cdcc2c40'
# Unpacked: (1, b'ab', 2.700000047683716)
复制代码


size属性告诉我们缓冲区需要多大。


目录
相关文章
|
4月前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
166 62
|
7天前
|
人工智能 自然语言处理 Shell
[oeasy]python070_如何导入模块_导入模块的作用_hello_dunder_双下划线
本文介绍了如何在Python中导入模块及其作用,重点讲解了`__hello__`模块的导入与使用。通过`import`命令可以将外部模块引入当前环境,增强代码功能。例如,导入`__hello__`模块后可输出“Hello world!”。此外,还演示了如何使用`help()`和`dir()`函数查询模块信息,并展示了导入多个模块的方法。最后,通过一个实例,介绍了如何利用`jieba`、`WordCloud`和`matplotlib`模块生成词云图。总结来说,模块是封装好的功能部件,能够简化编程任务并提高效率。未来将探讨如何创建自定义模块。
29 8
|
4天前
|
缓存 Shell 开发工具
[oeasy]python071_我可以自己做一个模块吗_自定义模块_引入模块_import_diy
本文介绍了 Python 中模块的导入与自定义模块的创建。首先,我们回忆了模块的概念,即封装好功能的部件,并通过导入 `__hello__` 模块实现了输出 &quot;hello world!&quot; 的功能。接着,尝试创建并编辑自己的模块 `my_file.py`,引入 `time` 模块以获取当前时间,并在其中添加自定义输出。
20 4
|
3月前
|
Python
Python Internet 模块
Python Internet 模块。
139 74
|
4月前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
150 63
|
4月前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性
|
4月前
|
Python
Python的模块和包
总之,模块和包是 Python 编程中非常重要的概念,掌握它们可以帮助我们更好地组织和管理代码,提高开发效率和代码质量
140 61
|
4月前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
4月前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。
|
2月前
|
Python
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
37 3

热门文章

最新文章