《编写高质量Python代码的59个有效方法》——第15条:了解如何在闭包里使用外围作用域中的变量

简介:

本节书摘来自华章社区《编写高质量Python代码的59个有效方法》一书中的第15条:了解如何在闭包里使用外围作用域中的变量,作者[美]布雷特·斯拉特金(Brett Slatkin),更多章节内容可以访问云栖社区“华章社区”公众号查看

第15条:了解如何在闭包里使用外围作用域中的变量
假如有一份列表,其中的元素都是数字,现在要对其排序,但排序时,要把出现在某个群组内的数字,放在群组外的那些数字之前。这种用法在绘制用户界面时候可能会遇到,我们可以用这个办法把重要的消息或意外的事件优先显示在其他内容前面。
实现该功能的一种常见做法,是在调用列表的sort方法时,把辅助函数传给key参数。这个辅助函数的返回值,将会用来确定列表中各元素的顺序。辅助函数可以判断受测元素是否处在重要群组中,并据此返回相应的排序关键字(sort key)。

这个函数能够应对比较简单的输入值。

这个函数之所以能够正常运作,是基于下列三个原因:
Python支持闭包(closure):闭包是一种定义在某个作用域中的函数,这种函数引用了那个作用域里面的变量。helper函数之所以能够访问sort_priority的group参数,原因就在于它是闭包。
Python的函数是一级对象(f?irst-class object),也就是说,我们可以直接引用函数、把函数赋给变量、把函数当成参数传给其他函数,并通过表达式及if语句对其进行比较和判断,等等。于是,我们可以把helper这个闭包函数,传给sort方法的key参数。
Python使用特殊的规则来比较两个元组。它首先比较各元组中下标为0的对应元素,如果相等,再比较下标为1的对应元素,如果还是相等,那就继续比较下标为2的对应元素,依次类推。
这个sort_priority函数如果能够改进一下,就更好了,它应该返回一个值,用来表示用户界面里是否出现了优先级较高的元件,使得该函数的调用者,可以根据这个返回值做出相应的处理。添加这样的功能,看似非常简单。既然该函数里的闭包函数,能够判断受测数字是否处在群组内,那么不妨在发现优先级较高的元件时,从闭包函数中翻转某个标志变量,然后令sort_priority函数把经过闭包修改的那个标志变量,返回给调用者。
我们先试试下面这种简单的写法:

用刚才那些输入数据,来运行这个函数:

排序结果是对的,但是found值不对。numbers里面的某些数字确实包含在group中,可是函数却返回了False。这是为什么呢?
在表达式中引用变量时,Python解释器将按如下顺序遍历各作用域,以解析该引用:
1)当前函数的作用域。
2)任何外围作用域(例如,包含当前函数的其他函数)。
3)包含当前代码的那个模块的作用域(也叫全局作用域,global scope)。
4)内置作用域(也就是包含len及str等函数的那个作用域)。
如果上面这些地方都没有定义过名称相符的变量,那就抛出NameError异常。
给变量赋值时,规则有所不同。如果当前作用域内已经定义了这个变量,那么该变量就会具备新值。若是当前作用域内没有这个变量,Python则会把这次赋值视为对该变量的定义。而新定义的这个变量,其作用域就是包含赋值操作的这个函数。
上面所说的这种赋值行为,可以解释sort_priority2函数的返回值错误的原因。将found变量赋值为True,是在helper闭包里进行的。于是,闭包中的这次赋值操作,就相当于在helper内定义了名为found的新变量,而不是给sort_priority2中的那个found赋值。

这种问题有时称为作用域bug(scoping bug),它可能会使Python新手感到困惑。其实,Python语言是故意要这么设计的。这样做可以防止函数中的局部变量污染函数外面的那个模块。假如不这么做,那么函数里的每个赋值操作,都会影响外围模块的全局作用域。那样不仅显得混乱,而且由于全局变量还会与其他代码产生交互作用,所以可能引发难以探查的bug。
1.?获取闭包内的数据
Python 3中有一种特殊的写法,能够获取闭包内的数据。我们可以用nonlocal语句来表明这样的意图,也就是:给相关变量赋值的时候,应该在上层作用域中查找该变量。nonlocal的唯一限制在于,它不能延伸到模块级别,这是为了防止它污染全局作用域。
下面用nonlocal来实现这个函数:

nonlocal语句清楚地表明:如果在闭包内给该变量赋值,那么修改的其实是闭包外那个作用域中的变量。这与global语句互为补充,global用来表示对该变量的赋值操作,将会直接修改模块作用域里的那个变量。
然而,nonlocal也会像全局变量那样,遭到滥用,所以,建议大家只在极其简单的函数里使用这种机制。nonlocal的副作用很难追踪,尤其是在比较长的函数中,修饰某变量的nonlocal语句可能和修改该变量的赋值操作离得比较远,从而导致代码更加难以理解。
如果使用nonlocal的那些代码,已经写得越来越复杂,那就应该将相关的状态封装成辅助类(helper class)。下面定义的这个类,与nonlocal所达成的功能相同。它虽然有点长,但是理解起来相当容易(其中有个名叫__call__的特殊方法,详情参见本书第23条)。

2.?Python 2中的值
不幸的是,Python 2不支持nonlocal关键字。为了实现类似的功能,我们需要利用Python的作用域规则来解决。这个做法虽然不太优雅,但已经成了一种Python编程习惯。

运行上面这段代码时,Python要解析found变量的当前值,于是,它会按照刚才所讲的变量搜寻规则,在上级作用域中查找这个变量。上级作用域中的found变量是个列表,由于列表本身是可供修改的(mutable,可变的),所以获取到这个found列表后,我们就可以在闭包里面通过found[0] = True语句,来修改found的状态。这就是该技巧的原理。
上级作用域中的变量是字典(dictionary)、集(set)或某个类的实例时,这个技巧也同样适用。
要点
对于定义在某作用域内的闭包来说,它可以引用这些作用域中的变量。
使用默认方式对闭包内的变量赋值,不会影响外围作用域中的同名变量。
在Python 3中,程序可以在闭包内用nonlocal语句来修饰某个名称,使该闭包能够修改外围作用域中的同名变量。
在Python 2中,程序可以使用可变值(例如,包含单个元素的列表)来实现与nonlocal语句相仿的机制。
除了那种比较简单的函数,尽量不要用nonlocal语句。

相关文章
|
4天前
|
安全 Python
告别低效编程!Python线程与进程并发技术详解,让你的代码飞起来!
【7月更文挑战第9天】Python并发编程提升效率:**理解并发与并行,线程借助`threading`模块处理IO密集型任务,受限于GIL;进程用`multiprocessing`实现并行,绕过GIL限制。示例展示线程和进程创建及同步。选择合适模型,注意线程安全,利用多核,优化性能,实现高效并发编程。
18 3
|
5天前
|
算法 安全 大数据
揭秘!Python堆与优先队列:数据结构的秘密武器,让你的代码秒变高效战士!
【7月更文挑战第8天】Python的heapq模块和queue.PriorityQueue提供堆与优先队列功能,助你提升算法效率。堆用于快速找大数据集的第K大元素,如示例所示,时间复杂度O(n log k)。PriorityQueue在多线程中智能调度任务,如模拟下载管理器,按优先级处理任务。掌握这些工具,让代码运行更高效!
19 1
|
3天前
|
编译器 Python
在小黑框如何用Python写出多行代码
在小黑框如何用Python写出多行代码
|
2天前
|
API 数据处理 Python
探秘Python并发新世界:asyncio库,让你的代码并发更优雅!
【7月更文挑战第11天】Python的asyncio库简化了单线程并发编程,利用协程和事件循环实现异步操作。async def定义异步函数,await挂起协程等待IO完成。例如,fetch_data模拟网络请求,main函数并发执行多个任务。asyncio.gather收集结果,Semaphore限制并发数,保证资源管理。asyncio提供高效优雅的并发解决方案。
18 4
|
1天前
|
数据可视化 PyTorch Serverless
Python 性能分析的几个方法,找到你代码中的那个她
我们在编写了一个脚本在笔记本上处理一些数据,然后去喝杯咖啡或者上了个厕所,15分钟后回来时发现进度才完成不到10%。 我们的脑袋里面就会发问:为什么这么慢?究竟是在哪个部分是慢的?是读取数据、处理数据还是保存数据?如何让它变快?它真的很慢吗? 有了这个疑问我们尝试去解决这个问题,下面我们介绍几个 python 性能分析的工具。
|
5天前
|
缓存 并行计算 Shell
12种增强Python代码的函数式编程技术
函数式编程是一种高度抽象的编程范式,它倡导使用纯函数,即那些不依赖于外部状态、没有可变状态的函数。在纯粹的函数式编程语言中,函数的输出完全由输入决定,因此相同的输入总是产生相同的输出,这样的函数我们称之为无副作用的。
|
3天前
|
API 开发者 Python
Python并发新纪元:asyncio库,让你的代码异步飞行,效率翻倍!
【7月更文挑战第10天】Python的asyncio库推动了异步编程革命,简化并发任务,提高I/O效率。通过事件循环和协程,asyncio允许程序在等待如HTTP请求时执行其他任务。例如,使用aiohttp并发获取多个网站数据,显著提升效率。随着asyncio生态成熟,它成为高效编程的必备工具,赋能开发者实现代码的“异步飞行”。
10 2
|
3天前
|
算法 计算机视觉 索引
python---OpenCv(二),背景分离方法较有意思
python---OpenCv(二),背景分离方法较有意思
|
3天前
|
存储 Python 容器
Python基础:变量和数据类型详解(整数、浮点数、字符串、布尔值)
变量和数据类型是Python编程的基础,理解这些概念对于编写高效和正确的代码至关重要。通过本文的介绍,希望你能对Python中的变量和常用数据类型有一个清晰的认识,并能够在实际编程中灵活运用这些知识。
|
3天前
|
存储 算法 搜索推荐
Python高手必备!揭秘图(Graph)的N种风骚表示法,让你的代码瞬间高大上
【7月更文挑战第10天】在Python中,图数据结构通过邻接矩阵、邻接表、边列表和邻接集来表示,用于社交网络分析和路径查找等。邻接矩阵用二维数组存储连接,邻接表仅存储每个节点的邻居,节省空间。边列表列出所有边,而邻接集用集合确保邻居唯一性。选择合适表示法能提升代码效率和可读性,展现编程技巧。
12 1