Python 3.12 目标:还可以更快!

简介: Python 3.12 目标:还可以更快!

本文内容可能会改动,以实际版本为准!

本文是 Faster CPython 计划在 3.12 中实现的主要内容的概要。

跟踪优化器

Python 3.11 提升速度的主要方法是用更快的与上下文相关的操作码(自适应的专门化操作码)替换个别的操作码,下一个大的改进方法是优化多个操作码的运行。

为此,现有的许多高级操作码将被替换成低级操作码,例如,用于检查版本号和引用计数的操作码。这些更简单的操作码更容易进行优化,例如,可以删除冗余的引用计数操作。

这些更底层的操作码还能让我们得到一组适合用于生成机器代码的指令(在 CPython 和第三方 JIT 项目中都适用)。

为了做到这点,解释器循环(interpreter loop)将基于声明性的描述而生成。

这可减少一部分为了保持解释器循环与某些相关函数同步而产生的 bug(mark_stacks、stack_effect 等函数),同时也让我们可以对解释器循环作较大的更改试验。

多线程并行

Python 当前每个进程有一个全局解释器锁(GIL),阻碍了多线程的并行。

PEP-684:peps.python.org/pep-0684

PEP-554:peps.python.org/pep-0554

image.png

PEP-684 提出了一个方案,即保证所有的全局状态都是线程安全的,并移动到每个子解释器的全局解释器锁中使用。

image.png

PEP-554 提出了让 Python 创建子解释器的方案(目前只是一个 C API 特性),从而实现真正的多线程并行。

Python猫注:PEP-554 早在 2017 年就提出了,目标是落地在 Python 3.8-3.9 版本,然而事与愿违。早在 2019 年的时候,我还翻译了一篇《Has the Python GIL been slain?》。屠刀已挥出,让它再飞一会~~

更多专门化

我们分析了哪些字节码将从专门化中获益最多,计划在 3.12 完成其余的高收益的改进。

github.com/faster-cpyt…

较小的对象结构

有许多可以减少 Python 对象结构大小的机会。由于它们被频繁使用,这不仅有利于总体的内存使用,还有利于缓存的一致性。我们计划在 3.12 中实现最有希望的一些想法。

这里有一些向后兼容性与性能之间的权衡问题,可能需要提出一个 PEP 来建立共识。

image.png

减少内存管理的开销

我们不仅会减小对象的大小,还会使它们的 layout 更加规则。

这不仅能优化内存的分配及释放,还能在 GC 和重新分配期间加快遍历对象的速度。

API 稳定性

除了前述项目外,开发团队还将提升 CPython 代码库的整体质量:

  • 通过减少不同编译阶段的耦合,使编译器更易于维护与测试。
  • 积极地在 C 语言级别监控和改进 CPython 测试套的代码覆盖率。
  • 改进 Python 性能基准测试套,加入更具代表性的现实世界的负载测试。
  • 协助处理 CPython 问题和 PR,特别是与性能有关的问题。
  • 增加用于标准基准测试的机器,增加 macOS 和 Windows 的测试结果。
  • 继续跟主要的深度使用 Python 内核的项目合作,帮助它们适配 CPython 解释器的更改。

注:文中图片为译者所加。


目录
相关文章
|
3月前
|
Python
【Leetcode刷题Python】494. 目标和
LeetCode 494题 "目标和" 的Python解决方案,通过动态规划算法计算在给定整数数组和目标值的情况下,可以构造多少种不同表达式使得运算结果等于目标值。
40 3
|
1月前
|
网络安全 Python
Python编程--目标IP地址段主机指定端口状态扫描
Python编程--目标IP地址段主机指定端口状态扫描
|
3月前
|
数据挖掘 数据处理 索引
python中目标数值在某一列中的索引
需要注意的是,当数值不在列表或数组中时,应妥善处理可能出现的异常情况。在Pandas中还可以使用更多复杂的条件来查找数据,这为数据分析带来了极大的便利。此外,在实际应用中,我们可能还需要考虑数值的重复问题,其中Pandas会返回所有匹配目标值的索引,而NumPy和基础列表的 `index()`则返回第一个匹配项的索引。需要根据具体应用场景做出合适的选择。
34 0
|
5月前
|
机器学习/深度学习 算法 安全
基于YOLOv8深度学习的危险区域人员闯入检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、区域闯入
基于YOLOv8深度学习的危险区域人员闯入检测与报警系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、区域闯入
|
4月前
|
数据可视化 Linux 数据格式
`seaborn`是一个基于`matplotlib`的Python数据可视化库,它提供了更高级别的接口来绘制有吸引力的和信息丰富的统计图形。`seaborn`的设计目标是使默认图形具有吸引力,同时允许用户通过调整绘图参数来定制图形。
`seaborn`是一个基于`matplotlib`的Python数据可视化库,它提供了更高级别的接口来绘制有吸引力的和信息丰富的统计图形。`seaborn`的设计目标是使默认图形具有吸引力,同时允许用户通过调整绘图参数来定制图形。
|
5月前
|
机器学习/深度学习 存储 监控
基于YOLOv8深度学习的无人机视角高精度太阳能电池板检测与分析系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割
基于YOLOv8深度学习的无人机视角高精度太阳能电池板检测与分析系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分割
|
5月前
|
机器学习/深度学习 计算机视觉 Python
深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数(3)
深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数
|
5月前
|
机器学习/深度学习 存储 算法
深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数(2)
深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数
|
5月前
|
机器学习/深度学习 计算机视觉 异构计算
基于YOLOv8深度学习的玉米叶片病害智能诊断与防治系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分类(2)
基于YOLOv8深度学习的玉米叶片病害智能诊断与防治系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分类
基于YOLOv8深度学习的玉米叶片病害智能诊断与防治系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战、目标分类(2)