引用计数器回收
一个对象,会记录着自身被引用的个数
每增加一个引用,这个对象的引用计数会自动+1
每减少一个引用,这个对象的引用计数会自动-1
查看引用计数
import sys sys.getrefcount(对象)
关于getrefcount:
getrefcount(object) -> integer
Return the reference count of object. The count returned is generally
one higher than you might expect, because it includes the (temporary)
reference as an argument to getrefcount().
注意下加粗的两个地方:
- 需要获取一个对象的引用次数,而非一个类
- 由于你通过
getrefcount
引用了这个对象,所以总引用次数要比实际多1
来个例子看看吧
import sys class Uranus: pass u1 = Uranus() print(sys.getrefcount(u1)-1) # 1 u3 = u2 = u1 print(sys.getrefcount(u1)-1) # 3 del u3 print(sys.getrefcount(u1)-1) # 2 del u2 print(sys.getrefcount(u1)-1) # 1 del u1 print(sys.getrefcount(u1)-1) # NameError: name 'u1' is not defined
引用+1场景
- 对象被创建会 +1
u1=Uranus()
- 对象被引用会 +1
u2=u1
- 对象作为参数传入到一个函数中会 +2
import sys class Uranus: pass u1 = Uranus() def func(obj): print(sys.getrefcount(obj)-1) func(u1)
为什么会+2呢?python3的有点难理解,但是Python2的可以直接打印一下
print([(i,getattr(func,i)) for i in dir(func)])
可以看到
__globals__
hefuncglobals__
都存在u1
- 对象作为一个元素,存储在容器中会 +1
list1=[u1]
引用-1的场景
- 对象被销毁
del u1
- 对象被赋予新的值
u1=Uranus() u1=1
- 一个对象离开他的作用域
如上面对象传入某个函数中,当函数执行完成后,引用会立即销毁
- 对象所在的容器被销毁
list1=[u1] del list1
特殊场景-循环引用问题
何为循环引用?怎么去计算?
此时我们需要使用一个模块objpraph
Count objects tracked by the garbage collector with a given class name.
import objgraph # 需要单独下载 class Person: pass class Animal: pass print(objgraph.count("Person")) # 0 print(objgraph.count("Animal")) # 0 P = Person() A = Animal() print(objgraph.count("Person")) # 1 print(objgraph.count("Animal")) # 1 P.pet = A A.master = P del P del A # 正常情况下,如果删除了P和A,应该为0,但由于循环引用,结果为1 print(objgraph.count("Person")) # 1 print(objgraph.count("Animal")) # 1
那这样不是GG思密达了?那怎么阔能!!!真这样的话Python还有谁用呢?
垃圾回收机制
从经历过引用计数器机制仍未被释放掉的对象中,找到循环引用并删除相关对象
何时启动垃圾回收
不是说你创建了一个变量,就会马上开始垃圾回收的!
需要你代码中,新增对象-消亡对象阈值达到某一个零界点是才会启动垃圾回收
如何查看这个阈值呢?需要引入GC
模块
import gc print(gc.get_threshold()) output: (700, 10, 10)
代码的结果是一个元组,后面两位之后说,700代表python设置的阈值
怎么找到循环引用
- 搜集所有容器对象,通过双向列表进行引用
容器对象:list couple dict ...
非容器对象:a=10 ...
- 针对每一个容器对象,通过一个变量
gc_refs
来记录当前对应的引用计数 - 对于每一个容器对象,找到它引用的容器对象,并将这个容器对象的引用计数-1
- 如果经历以上三次,如果一个容器对象的引用次数为0,就代表可以被回收了
通过上面的循环引用查找,也许有的人认为比较简单,但是如果一个大的项目,存在着成千上万的容器对象,这么每次去检测岂不是要累死?
python考虑到此处,所以创建了一套回收机制,叫做分代回收
分代回收
何为分代回收,当第一次检测完成后,部分的容器对象没有为0,则将其从0代移动至1代对象中,当检测10次后,在第11次时,会再次扫描0代1代的对象,当101次,即1代对象也被检测了10次,仍存在未被回收的容器对象时,会将器移动至2代中。多像爷爸孙....
至于为什么是10,就是刚才我们查看gc.get_threshold()得到的元组后两个字段。
当然我们也可以进行手动设置:
gc.set_threshold(100,5,5)
但劝你没事儿还是别瞎折腾....
垃圾回收的开启、关闭、状态查询
垃圾回收机制,默认都是开启的,当然我们可以进行调整
gc.disable() gc.enable() gc.isenabled()
如何手动触发垃圾回收
通过gc.collect()
手动触发垃圾回收。
此处需要注意一点,即便目前的垃圾回收机制处于关闭状态,一样可以手动触发。
如何避免循环引用
使用弱引用模块
import weakref A.master = weakref.ref(P) # 此时会生成弱引用
何为弱引用,即在引用的时候,不会是计数器+1
但是weakref.ref只是针对单个引用的,如果是多个呢?
使用:
weakref.WeakKeyDictionary weakref.WeakValueDictionary weakref.WeakSet
手动使引用计数-1
A.master = None
通过重新赋值的方法,是不是也可以达到这种方式呢?