Pickle模块的作用
Pickle模块用于将python对象序列化为字节流,可存储在文件或数据库中,也可同通过网络进行传输。使用反序列化(Unpickle)可以将生成的字节流转换回python对象。“Pickling”是将Python对象层次结构转换为字节流的过程,“unpickling”是反向操作,从而将字节流(来自二进制文件或类似字节的对象)转换回对象层次结构。酸洗(或去除)也可称为“序列化”,“编组”,不要将其与marshal模块混淆或“扁平化”; 但是,为了避免混淆,这里使用的术语是“酸洗”和“破坏”。
什么叫序列化?
把对象在内存中的结构转换成便于存储或传输的二进制或文本格式,而且以后可以在同一个系统或不同的系统中重建对象的副本。pickle模块能把任何Python对象序列化成二进制格式。
函数的运用
Pickle模块中dump()函数与load()函数的运用
pickle模块提供以下常量:
pickle.HIGHEST_PROTOCOL
整数,可用的最高协议版本。该值可以作为协议值传递给函数dump()和dumps()以及pickler构造函数。
pickle.DEFAULT_PROTOCOL
一个整数,用于酸洗的默认协议版本。可能小于最高协议。目前默认的协议是3,这是为python 3设计的新协议。
pickle模块提供以下功能,使酸洗过程更加方便:
pickle.dump(obj,file,protocol = None,*,fix_imports = True )
将obj的pickle d表示写入打开的文件对象文件。这相当于。 Pickler(file, protocol).dump(obj)
可选的协议参数,一个整数,告诉pickler使用给定的协议; 支持的协议是0到HIGHEST_PROTOCOL。如果未指定,则默认为DEFAULT_PROTOCOL。如果指定了负数,HIGHEST_PROTOCOL则选择。
文件参数必须有一个接受单字节参数的write()方法。因此,它可以是一个为二进制写入而打开的磁盘上文件、一个IO.Bytesio实例或满足此接口的任何其他自定义对象。
如果fix_导入为真,且协议小于3,pickle将尝试将新的python 3名称映射到python 2中使用的旧模块名称,以便pickle数据流可以用python 2读取。
pickle.dumps(obj,protocol =None,*,fix_imports = True )
将对象的pickled表示作为bytes对象返回,而不是将其写入文件。
arguments协议和fix_导入的含义与dump()中的含义相同。
pickle.load(file,*,fix_imports = True,encoding =“ASCII”,errors =“strict”)
从打开的文件对象文件中读取pickled对象表示,并返回其中指定的重新构建的对象层次结构。这相当于unpickler(file.load()。
自动检测pickle的协议版本,因此不需要协议参数。超过pickled对象表示形式的字节将被忽略。
参数文件必须有两个方法,一个采用整数参数的read()方法和一个不需要参数的readline()方法。两种方法都应返回字节。因此,文件可以是为二进制读取而打开的磁盘上文件、IO.Bytesio对象或满足此接口的任何其他自定义对象。
可选关键字参数包括fix_导入、编码和错误,这些参数用于控制由python 2生成的pickle流的兼容性支持。如果fix_imports为true,pickle将尝试将旧的python 2名称映射到python 3中使用的新名称。编码和错误告诉pickle如何解码由python 2处理的8位字符串实例;它们分别默认为'ascii'和'strict'。编码可以是“字节”,以将这些8位字符串实例读取为字节对象。需要使用encoding='latin1'来取消拾取由python 2处理的numpy数组和date time、日期和时间实例。
pickle.loads(bytes_object,*,fix_imports = True,encoding =“ASCII”,errors =“strict”)
从bytes对象读取pickled对象层次结构,并返回其中指定的重新构建的对象层次结构。
自动检测pickle的协议版本,因此不需要协议参数。超过pickled对象表示形式的字节将被忽略。
可选关键字参数包括fix_导入、编码和错误,这些参数用于控制由python 2生成的pickle流的兼容性支持。如果fix_imports为true,pickle将尝试将旧的python 2名称映射到python 3中使用的新名称。编码和错误告诉pickle如何解码由python 2处理的8位字符串实例;它们分别默认为'ascii'和'strict'。编码可以是“字节”,以将这些8位字符串实例读取为字节对象。需要使用encoding='latin1'来取消拾取由python 2处理的numpy数组和date time、日期和时间实例。