[oeasy]python0019_ 打包和解包_struct_pack_unpack

简介: [oeasy]python0019_ 打包和解包_struct_pack_unpack

 

打包和解包

回忆上次内容

    • ASCII 由这样几类字符构成
      • 英文大写字符
      • 英文小写字符
      • 数字
      • 符号
        • 电报时代对于英文、数字的编码
          • 使用的是摩斯电码

          image.gif编辑

            • 这摩斯电码是3进制的编码方式
              • 长短空
                • 怎么演化成ascii这种0101的二进制编码的呢?🤔

                回到 ASCII 码

                  • 电报传过来的信号需要记录下来
                    • 于是有了电传打字机(tele-typewriter)
                    • 电传打字机需要统一的编码字母和数字
                      • ASCII的第一个商业用途
                        • 是作为一个七位电传打字机(tele-typewriter)代码

                        image.gif编辑

                          • 要把滴、答、停的电报信号
                            • 变成0和1的二进制信号

                            ASCII的演化(evolve)

                              • 1960年10月6日
                                • 美国标准协会(ASA)X3的首次会议
                                • ASCII标准的工作开始了
                                • 美国标准协会
                                  • 现为美国国家标准协会
                                  • American National Standards Institute
                                  • 简称ANSI
                                    • 开始敲定ASCII具体编码

                                    正在上传…重新上传取消

                                      • 贝尔公司主要经营电报电话

                                      编码来源

                                        • 第一次(ASA X3.4-1963)就明确
                                          • 大小写字母之间只差一个位
                                          • 这很重要

                                          image.gif编辑

                                            • 否则错误编码一旦成为标准
                                              • 所有应用这种错误编码的文件
                                                • 就都废掉了
                                                  • 我想把所有 ASCII 字符 0-127 全都打出来
                                                    • 可以么?

                                                    回忆show.py

                                                      for n in range(0xff):

                                                         print(chr(n),end="")

                                                         if n % 16 == 0:

                                                             print()

                                                        • 确实可以出来

                                                        image.gif编辑

                                                          • 这输出靠的是
                                                            • 把序号转化成字符的函数
                                                              • chr
                                                                • 但是没有看到0
                                                                  • 理论上在1之前
                                                                  • 仿佛被黑暗森林所吞没
                                                                    • 我能否将字节解码(decode)来干这个事?

                                                                    struct

                                                                      • 首先是要获得从0到127的字节状态
                                                                      • struct 是一个包(module)
                                                                        • 导入struct包

                                                                        image.gif编辑

                                                                          • struct是结构的意思
                                                                            • 来自于c里面常用类型的存储结构
                                                                            • 这个struct怎么用呢?

                                                                            pack

                                                                            image.gif编辑

                                                                              • 把数字变成字节的形态
                                                                                • 把0x61这个数字变成字节的形态

                                                                                image.gif编辑

                                                                                  • "a" 不是字符吗?🤔
                                                                                    • 怎么成了字节了?

                                                                                    字节表示法

                                                                                      • 注意细节

                                                                                      image.gif编辑

                                                                                        • 注意"a"前面还有一个b
                                                                                          • "a"是字符
                                                                                          • b"a" 是字节

                                                                                          image.gif编辑

                                                                                            • 这两类型完全不同
                                                                                            • 字节b"a"是什么呢?

                                                                                            字节形态

                                                                                              • 字节状态可以用两个16进制数来表示
                                                                                                • b"a"
                                                                                                  • 相当于b"\x61"

                                                                                                  image.gif编辑

                                                                                                    • b"a" 和 b"\x61" 是同样的一个字节
                                                                                                      • 就是字符"a"在字节里的样子

                                                                                                      image.gif编辑

                                                                                                        • 为了清楚起见
                                                                                                          • 把b"\x61"表示为b"a"
                                                                                                          • 这样也就直接看到了字符😂
                                                                                                          • 刚好ord("a") 就是 0x61
                                                                                                            • 如何理解struct.pack呢?

                                                                                                            封包pack

                                                                                                              • 按要求把东西封进规定的封装里面

                                                                                                              image.gif编辑

                                                                                                                • 把数字封在1个Byte里面
                                                                                                                  • 观察他的字节状态

                                                                                                                  遍历

                                                                                                                  import struct

                                                                                                                  for n in range(0,128):

                                                                                                                     b = struct.pack("b",n)

                                                                                                                     print(b,end=",")

                                                                                                                    • 把从0-127的数字都封到字节里面

                                                                                                                    image.gif编辑

                                                                                                                      • 可以把数字转化成字节状态
                                                                                                                        • 然后可以再把字节解码了

                                                                                                                        遍历结果

                                                                                                                          • 好多的字节呀~😄

                                                                                                                          image.gif编辑

                                                                                                                            • 从字节状态可以看到已经有
                                                                                                                              • 0、1、2、3
                                                                                                                                • 这里很明显能看到0
                                                                                                                                • 还有0前面的一堆符号
                                                                                                                                  • A、B、C
                                                                                                                                  • a、b、c
                                                                                                                                    • 还有
                                                                                                                                      • \r、\n、\t
                                                                                                                                      • 这是啥意思?🤔
                                                                                                                                      • 怎么还能有两个字符呢?
                                                                                                                                      • 不管他
                                                                                                                                        • 先加上换行

                                                                                                                                        换行

                                                                                                                                        image.gif编辑

                                                                                                                                          • 从0数到7
                                                                                                                                            • 换1行
                                                                                                                                            • 再从0数到7

                                                                                                                                            image.gif编辑

                                                                                                                                              • 隐约看到了ascii码的结构
                                                                                                                                                • 我不想看字节状态呢
                                                                                                                                                  • 我想看字符状态
                                                                                                                                                    • 需要对字节状态解码(decode)
                                                                                                                                                      • 也就是解包
                                                                                                                                                        • struct.unpack

                                                                                                                                                        解包

                                                                                                                                                          • 这又是一圈
                                                                                                                                                            • pack
                                                                                                                                                            • unpack

                                                                                                                                                            image.gif编辑

                                                                                                                                                              • 解包出来是序号
                                                                                                                                                              • 先把0-127的数字都变成字节

                                                                                                                                                              封包再解包

                                                                                                                                                              import struct

                                                                                                                                                              for n in range(0,127):

                                                                                                                                                                 b = struct.pack("b",n)

                                                                                                                                                                 c = struct.unpack("b",b)[0]

                                                                                                                                                                 print(chr(c),end="")

                                                                                                                                                                 if n % 16 == 0:

                                                                                                                                                                     print()

                                                                                                                                                                • 依然要面对黑暗森林

                                                                                                                                                                image.gif编辑

                                                                                                                                                                封包再解码

                                                                                                                                                                import struct

                                                                                                                                                                for n in range(0,127):

                                                                                                                                                                   b = struct.pack("b",n)

                                                                                                                                                                   s = b.decode("ascii")

                                                                                                                                                                   print(s,end="")

                                                                                                                                                                   if n % 16 == 0:

                                                                                                                                                                       print()

                                                                                                                                                                  • 运行一下
                                                                                                                                                                  • 上面那片依然是全黑的?

                                                                                                                                                                  image.gif编辑

                                                                                                                                                                    • 和原来chr方法得到的结果差不多
                                                                                                                                                                    • 但是没有看到字符0
                                                                                                                                                                      • 仿佛被上面那片黑暗森林所吞没
                                                                                                                                                                      • 这可真可怕!
                                                                                                                                                                        • 我们先去总结一下吧

                                                                                                                                                                        总结

                                                                                                                                                                          • struct包可以让我们使用封包格式
                                                                                                                                                                            • 把数字封包到字节里
                                                                                                                                                                              • pack函数就是封包
                                                                                                                                                                              • unpack函数就是解封
                                                                                                                                                                                • 我们通过封到不同字节的数字
                                                                                                                                                                                  • 遍历了一次ascii码

                                                                                                                                                                                  image.gif编辑

                                                                                                                                                                                    • 还是有那片黑色的区域
                                                                                                                                                                                      • 好像是一片黑暗森林!
                                                                                                                                                                                      • 那里面到底有些什么秘密?🤔
                                                                                                                                                                                        相关文章
                                                                                                                                                                                        |
                                                                                                                                                                                        1天前
                                                                                                                                                                                        |
                                                                                                                                                                                        安全 网络安全 数据安全/隐私保护
                                                                                                                                                                                        `certifi`是一个Python包,它提供了一个包含Mozilla证书颁发机构(CA)Bundle的PEM文件。
                                                                                                                                                                                        `certifi`是一个Python包,它提供了一个包含Mozilla证书颁发机构(CA)Bundle的PEM文件。
                                                                                                                                                                                        19 7
                                                                                                                                                                                        |
                                                                                                                                                                                        6天前
                                                                                                                                                                                        |
                                                                                                                                                                                        存储 Python
                                                                                                                                                                                        Python之日期和时间包datetime的使用
                                                                                                                                                                                        1、基本定义 1.1 时间戳 时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数(或总毫秒数)。 网上有很多时间戳在线转换工具,可以自行计算验证。
                                                                                                                                                                                        |
                                                                                                                                                                                        1天前
                                                                                                                                                                                        |
                                                                                                                                                                                        存储 Python 容器
                                                                                                                                                                                        `click`是一个用于构建命令行接口的Python包,它提供了简单、可组合的命令行解析器。
                                                                                                                                                                                        `click`是一个用于构建命令行接口的Python包,它提供了简单、可组合的命令行解析器。
                                                                                                                                                                                        5 0
                                                                                                                                                                                        |
                                                                                                                                                                                        1天前
                                                                                                                                                                                        |
                                                                                                                                                                                        存储 开发者 网络架构
                                                                                                                                                                                        在Python中,`setuptools`是一个强大的工具,用于帮助开发者打包和分发他们的Python代码库。
                                                                                                                                                                                        在Python中,`setuptools`是一个强大的工具,用于帮助开发者打包和分发他们的Python代码库。
                                                                                                                                                                                        5 0
                                                                                                                                                                                        |
                                                                                                                                                                                        6天前
                                                                                                                                                                                        |
                                                                                                                                                                                        Python
                                                                                                                                                                                        【Python】已解决:(from docx import Document导包报错)ModuleNotFoundError: No module named ‘exceptions’
                                                                                                                                                                                        【Python】已解决:(from docx import Document导包报错)ModuleNotFoundError: No module named ‘exceptions’
                                                                                                                                                                                        7 0
                                                                                                                                                                                        |
                                                                                                                                                                                        6天前
                                                                                                                                                                                        |
                                                                                                                                                                                        机器学习/深度学习 文字识别 开发者
                                                                                                                                                                                        【Python】已解决:(paddleocr导包报错)ModuleNotFoundError: No module named ‘paddle’
                                                                                                                                                                                        【Python】已解决:(paddleocr导包报错)ModuleNotFoundError: No module named ‘paddle’
                                                                                                                                                                                        15 0
                                                                                                                                                                                        |
                                                                                                                                                                                        6天前
                                                                                                                                                                                        |
                                                                                                                                                                                        XML JavaScript 数据格式
                                                                                                                                                                                        【Python】已解决:(Python xml库 import xml.dom.minidom导包报错)‘No module named dom’
                                                                                                                                                                                        【Python】已解决:(Python xml库 import xml.dom.minidom导包报错)‘No module named dom’
                                                                                                                                                                                        9 0
                                                                                                                                                                                        |
                                                                                                                                                                                        6天前
                                                                                                                                                                                        |
                                                                                                                                                                                        文字识别 计算机视觉 Python
                                                                                                                                                                                        【Python】已解决:(paddleocr导包报错)ModuleNotFoundError: No module named ‘layoutparser’
                                                                                                                                                                                        【Python】已解决:(paddleocr导包报错)ModuleNotFoundError: No module named ‘layoutparser’
                                                                                                                                                                                        9 0
                                                                                                                                                                                        |
                                                                                                                                                                                        6天前
                                                                                                                                                                                        |
                                                                                                                                                                                        安全 Python
                                                                                                                                                                                        告别低效编程!Python线程与进程并发技术详解,让你的代码飞起来!
                                                                                                                                                                                        【7月更文挑战第9天】Python并发编程提升效率:**理解并发与并行,线程借助`threading`模块处理IO密集型任务,受限于GIL;进程用`multiprocessing`实现并行,绕过GIL限制。示例展示线程和进程创建及同步。选择合适模型,注意线程安全,利用多核,优化性能,实现高效并发编程。
                                                                                                                                                                                        20 3