1.1 可变对象和不可变对象
从一道简单的面试题开始:list
和tuple
区别
在list
集合中可以实现元素的添加、修改、插入、以及删除,由下面的例子可看出并没有要求list
里的每个元素必须是相同的数据类型。
list = [1, 'abc'] print(list) # 输出[1, 'abc']
在tuple集合中,一旦元素被存储,以后就不能修改,删除了,这比list集合安全许多,所以能用tuple就用tuple。
回顾:不可变对象:数字 字符串 元组tuple ;可变对象:字典 列表list 字节数组。
1.2 Python垃圾回收
Python中万物皆对象,在Python中的存储问题也是对象的存储问题。python变量不许指定类型,程序员也无需关心内存管理,因为有Python内存管理器:python内存池 + 垃圾回收机制。
(1)垃圾回收
垃圾回收主要以引用计数为主,缺点:不能解决对象的“循环引用”、需要额外空间维护引用计数
引用计数改变的情况:
以下四种情况,对象的引用计数+1:
对象被创建(a=11)、
对象被引用(b=a)、
对象被作为参数传到函数中 func(a)、
对象作为一个元素存储在容器中(如lst1=[a,a])
以下四种情况,对象的引用计数-1:
对象的别名被显式销毁 del a、
对象的别名被赋予新的对象 a=66、
一个对象离开其作用域(如fun函数执行完,
fun里的局部变量,注意全局变量不会),对象所在的容器被销毁或从容器中删除对象
#!/usr/bin/python ## -*- coding: utf-8 -*- import sys def func(c): print ('in func function',sys.getrefcount(c)-1) print ('init',sys.getrefcount(11)-1) a=11 print ('after a=11----',sys.getrefcount(11)-1) b=a print ('after b=a----',sys.getrefcount(11)-1) func(11) #调用函数中是+2:另一个引用是函数栈保存了入参对形参的引用 print ('after func(11)----',sys.getrefcount(11)-1) lst1=[a,12,14] print ('after lst1=[a,12,14]----',sys.getrefcount(11)-1) a=666 print ('after a=666----',sys.getrefcount(11)-1) del a print ('after del a----',sys.getrefcount(11)-1) del b print ('after del b----',sys.getrefcount(11)-1) del lst1 print ('after del lst1----',sys.getrefcount(11)-1)
结果为
init 50 after a=11---- 51 after b=a---- 52 in func function 54 after func(11)---- 52 after lst1=[a,12,14]---- 53 after a=666---- 52 after del a---- 52 after del b---- 51 after del lst1---- 50
(2)标记-清除 and 分代回收
垃圾回收机制以引用机制为主,标记-清除,和分代回收机制为辅的策略:
标记-清除机制:用来解决计数引用带来的循环引用而无法释放内存的问题(循环引用只有在容器对象才会产生,如字典、元组、列表等);
标记阶段,遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达
清除阶段,再次遍历对象,如果发现某个对象没有标记为可达(即为Unreachable),则就将其回收
分代回收机制:为提升提升垃圾回收的效率。
1.3 Python内存池
Python内存管理器除了典型的垃圾回收机制,还有Python内存池,下图为CPython(Python解释器)的内存架构图:
python的对象管理主要位于Level+1~Level+3层
Level+3层:对于python内置的对象(比如int,dict等)都有独立的私有内存池,对象之间的内存池不共享,即int释放的内存,不会被分配给float使用
Level+2层:当申请的内存大小小于256KB时,内存分配主要由 Python 对象分配器(Python’s object allocator)实施
Level+1层:当申请的内存大小大于256KB时,由Python原生的内存分配器进行分配,本质上是调用C标准库中的malloc/realloc等函数
关于释放内存方面,当一个对象的引用计数变为0时,Python就会调用它的析构函数。调用析构函数并不意味着最终一定会调用free来释放内存空间,如果真是这样的话,那频繁地申请、释放内存空间会使Python的执行效率大打折扣。因此在析构时也采用了内存池机制,从内存池申请到的内存会被归还到内存池中,以避免频繁地申请和释放动作。