Python 中的垃圾收集

简介: 【8月更文挑战第24天】

垃圾收集 (GC) 是一种自动内存管理技术,它可以回收不再使用的对象所占用的内存。在 Python 中,GC 由称为引用计数的机制实现。

引用计数

Python 中的每个对象都有一个引用计数器,它跟踪指向该对象的引用数。当一个对象被创建时,其引用计数器被设置为 1。每当一个变量或数据结构引用该对象时,其引用计数器就会增加。当引用该对象的变量或数据结构被销毁时,其引用计数器就会减少。

当一个对象的引用计数器变为 0 时,这意味着不再有变量或数据结构引用该对象,该对象就被视为垃圾。GC 会定期运行,回收所有垃圾对象的内存。

垃圾收集循环

GC 循环是一个后台进程,它定期运行以查找和回收垃圾对象。GC 循环的工作原理如下:

  1. 标记阶段:GC 循环从根对象开始(例如全局变量和栈帧中的局部变量),并标记所有可达的对象。可达对象是指从根对象可以访问的对象。
  2. 清除阶段:GC 循环遍历所有未标记的对象,并将其视为垃圾。GC 循环释放这些对象的内存,并将它们从程序的内存空间中移除。

引用循环

引用循环会阻止 GC 回收对象,即使它们不再被使用。引用循环是指两个或多个对象相互引用,从而导致它们的引用计数器永远不为 0。

例如:

import gc

class MyClass:
    def __init__(self, other):
        self.other = other

# 创建两个相互引用的对象
obj1 = MyClass(None)
obj2 = MyClass(obj1)

# 设置两个对象的引用为 None,但它们仍然相互引用
obj1.other = None
obj2.other = None

# 此时,obj1 和 obj2 都应该被回收,但由于引用循环,它们不会被回收
gc.collect()  # 不会回收 obj1 和 obj2

弱引用

为了解决引用循环的问题,Python 提供了弱引用的概念。弱引用不会增加对象的引用计数器,并且在 GC 循环期间会被忽略。这使得 GC 可以回收具有弱引用的对象,即使它们仍然被其他对象引用。

弱引用可以使用 weakref 模块中的 WeakReference 类来创建。

import weakref

class MyClass:
    def __init__(self, other):
        self.other = weakref.ref(other)

# 创建两个相互引用的对象
obj1 = MyClass(None)
obj2 = MyClass(obj1)

# 设置两个对象的引用为 None,但它们仍然通过弱引用相互引用
obj1.other = None
obj2.other = None

# 此时,obj1 和 obj2 都可以被回收
gc.collect()  # 将回收 obj1 和 obj2

禁用垃圾收集

在某些情况下,可能需要禁用 Python 的 GC。这可以通过设置 PYTHONOPTIMIZE 环境变量为 2 来实现。

PYTHONOPTIMIZE=2 python my_script.py

禁用 GC 会提高程序的性能,但也会增加内存泄漏的风险。因此,不建议在生产环境中禁用 GC。

结论

Python 中的垃圾收集是一种自动内存管理机制,它可以回收不再使用的对象所占用的内存。GC 通过引用计数来实现,并且使用引用循环和弱引用来处理引用循环。虽然 GC 可以极大地简化内存管理,但理解其工作原理对于编写高效且无内存泄漏的 Python 程序非常重要。

目录
相关文章
|
10月前
|
监控 Java 开发者
Python的垃圾收集机制有哪些?
Python的垃圾收集机制有哪些?
|
Java 程序员 Python
Python垃圾回收机制详解:引用计数与循环垃圾收集器
Python垃圾回收机制详解:引用计数与循环垃圾收集器
458 0
|
6月前
|
机器学习/深度学习 存储 设计模式
Python 高级编程与实战:深入理解性能优化与调试技巧
本文深入探讨了Python的性能优化与调试技巧,涵盖profiling、caching、Cython等优化工具,以及pdb、logging、assert等调试方法。通过实战项目,如优化斐波那契数列计算和调试Web应用,帮助读者掌握这些技术,提升编程效率。附有进一步学习资源,助力读者深入学习。
|
3月前
|
Python
Python编程基石:整型、浮点、字符串与布尔值完全解读
本文介绍了Python中的四种基本数据类型:整型(int)、浮点型(float)、字符串(str)和布尔型(bool)。整型表示无大小限制的整数,支持各类运算;浮点型遵循IEEE 754标准,需注意精度问题;字符串是不可变序列,支持多种操作与方法;布尔型仅有True和False两个值,可与其他类型转换。掌握这些类型及其转换规则是Python编程的基础。
211 33
|
2月前
|
数据采集 分布式计算 大数据
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
87 1
|
3月前
|
设计模式 安全 Python
Python编程精进:正则表达式
正则表达式是一种强大的文本处理工具,用于搜索、匹配和提取模式。本文介绍了正则表达式的语法基础,如`\d`、`\w`等符号,并通过实例展示其在匹配电子邮件、验证电话号码、处理日期格式等场景中的应用。同时,文章提醒用户注意性能、编码、安全性等问题,避免常见错误,如特殊字符转义不当、量词使用错误等。掌握正则表达式能显著提升文本处理效率,但需结合实际需求谨慎设计模式。
135 2
|
4月前
|
数据采集 安全 BI
用Python编程基础提升工作效率
一、文件处理整明白了,少加两小时班 (敲暖气管子)领导让整理100个Excel表?手都干抽筋儿了?Python就跟铲雪车似的,哗哗给你整利索!
115 11
|
6月前
|
人工智能 Java 数据安全/隐私保护
[oeasy]python081_ai编程最佳实践_ai辅助编程_提出要求_解决问题
本文介绍了如何利用AI辅助编程解决实际问题,以猫屎咖啡的购买为例,逐步实现将购买斤数换算成人民币金额的功能。文章强调了与AI协作时的三个要点:1) 去除无关信息,聚焦目标;2) 将复杂任务拆解为小步骤,逐步完成;3) 巩固已有成果后再推进。最终代码实现了输入验证、单位转换和价格计算,并保留两位小数。总结指出,在AI时代,人类负责明确目标、拆分任务和确认结果,AI则负责生成代码、解释含义和提供优化建议,编程不会被取代,而是会更广泛地融入各领域。
186 28
|
6月前
|
机器学习/深度学习 数据可视化 TensorFlow
Python 高级编程与实战:深入理解数据科学与机器学习
本文深入探讨了Python在数据科学与机器学习中的应用,介绍了pandas、numpy、matplotlib等数据科学工具,以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目,如数据可视化和鸢尾花数据集分类,帮助读者掌握这些技术。最后提供了进一步学习资源,助力提升Python编程技能。
|
6月前
|
设计模式 机器学习/深度学习 前端开发
Python 高级编程与实战:深入理解设计模式与软件架构
本文深入探讨了Python中的设计模式与软件架构,涵盖单例、工厂、观察者模式及MVC、微服务架构,并通过实战项目如插件系统和Web应用帮助读者掌握这些技术。文章提供了代码示例,便于理解和实践。最后推荐了进一步学习的资源,助力提升Python编程技能。

热门文章

最新文章

推荐镜像

更多