Python避坑指南（续）-阿里云开发者社区

Python避坑指南（续）

2023-05-19 361

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文收集整理了所有Python编程中可能遇到的坑，教你如何避开这些坑，写出健壮、高效的Python代码。

在上一篇《Python避坑指南》中，我重点给大家讲了Python可变容器数据类型中的坑。除了这些，Python还有其他一些细小方面的坑，本章为大家讲解Python中这些大家可能会忽视的细节。

lambda的坑

看下面的代码，思考一下会输出什么？

def m():
    return [lambda x:x*i for i in range(4)]

a = m()
for a in m():
    print(a(1))

你可能以为会输出：

正确答案是：

这是因为在 [lambda x:x*i for i in range(4)] 列表解析式中，i在lambda声明之外，也就是说i相对lambda来说是个外部变量。当列表解析式运行完后，i的值就定格为3。

我们可以通过简单的方法来验证:

for a in m():
    print(a.__code__.co_code)
    print(a(1))

从上面的代码输出你会发现，对a的内部代码输出都是一样的，这说明列表中的lambda的逻辑都是一样的。所以输出结果也是一样的。

链式`or`的坑

Python支持简化链式逻辑判断。比如：

if a > 1 and a < 3:

可以简化成：

if 1 < a < 3:

当多个相等判断连接时，比如

if a == 3 or b == 3 or c == 3:

可能有人会简化成这样：

if a or b or c == 3: # ！这是错的！

注意：上面的代码是错的！因为or比==的优先级要低。上面表达式的执行顺序是 if (a) or (b) or (c == 3):

替代链式or的更好的方法是用系统内置的any()方法。

if any([a == 3, b == 3, c == 3]): # 正确

如果嫌上面代码太重复，编码不够高效，可以优化成下面这种写法：

if any(x == 3 for x in (a, b, c)): # 正确

如果比较的值都是相同的，还可以进一步简化为：

if 3 in (a, b, c): # 正确

这里我们用in判断要比较的值是否在待比较的变量构成的元组中。

同理，下面这种写法也是不对的：

if a == 1 or 2 or 3:

应该这样写：

if a in (1, 2, 3):

访问字面量属性的坑

Python中一切皆对象，即便是字面量也是对象。例如7，在Python中也是对象。这也就意味着7也有属性和方法。例如bit_length()这个方法，它会返回表示这个值所需的二进制位数。

x = 7
x.bit_length()
# Out: 3

上面的代码是可以正确输出的。应为7的二进制是111，需要3位二进制来表示，所以bit_length()会返回3。你可能直观地感觉7.bit_length()也一样会返回3。但不幸的是你会得到SyntaxError。为什么会这样？这是因为Python中.有两重含义，即可以是访问对象的属性，也可以是表示浮点数。Python解析器需要区分到底是哪一种含义。7.bit_length() 和 7.2 解析器无法区分，因此会报语法错误。

有两种办法可以直接访问字面量的属性：

(7).bit_length() # 用括号将字面量括起来，告诉解析器这里7不是个浮点数
7 .bit_length()  # 7后面加个空格，告诉解析器这里7不是个浮点数

注意：这里加两个点7..bit_length是不对的。这样写第一个点会被理解为浮点数，第二个点会访问对象的属性。虽然语法上没有歧义，但是浮点数是没有bit_length()方法的。这里如果访问的是浮点数对象有的属性或方法，程序是可以正常运行的。

7..as_integer_ratio()
# Out: (7, 1)

`is`的坑

编程过程中，整型和字符串是使用最多的数据类型。为了减少整型和字符串频繁创建带来的内存开销，Python会用内部缓存一定范围的整数和字符串。当我们用is判断两个对象是否是同一个对象时，这里的内部缓存机制可能会带来让人迷惑的结果。比如：

>>> -8 is (-7 - 1)
False
>>> -3 is (-2 - 1)
True

再举一个例子：

>>> (255 + 1) is (255 + 1)
True
>>> (256 + 1) is (256 + 1)
False

这里的输出结果着实让人疑惑。-3, 255就返回True，-8, 256就是False。

更具体地说，在[-5, 255]区间内地整型在Python解析器启动时会放入内部缓存。因此用is判断这个区间内的整型是否是同一对象时会返回True。不在这个区间内地整型会在使用时创建，所以即便值相同，但在内存中不是同一对象，因此会返回False。

⚠注意，可能编译器版本不同，内部缓存地范围可能不同。

解决这个问题的方法就是永远用==判断值是否相等，不要用is。

⚠注意，在Python交互式运行环境下，用is判断值相等会受到一条警告：

SyntaxWarning: "is" with a literal. Did you mean "=="?

字符串也是同样道理，永远用==判断值相等！

GIL全局锁的坑

GIL全局锁大家可能比较陌生，它跟多线程有关。在处理多线程时，全局锁有时可能会产生疑惑。请看下面这个例子：

import math
from threading import Thread

def calc_fact(num):
    math.factorial(num)

num = 600000
t = Thread(target=calc_fact, daemon=True, args=[num])
print("About to calculate: {}!".format(num))
t.start()
print("Calculating...")
t.join()
print("Calculated")

你可能以为Calculating...会在线程启动后立即打印出来，毕竟我们将calc_fact()这个比较耗时的运算放到了线程中执行。但实际上他会在计算完成后才打印。这是因为math.factorial()背后是C语言实现，线程在执行C语言实现函数时会锁住GIL直到运行结束。

有多种方法可以绕开这个问题。

第一种方法，你可以用纯Python来实现factorial的功能。

def calc_fact(num):
    """ 纯Python实现阶乘 """
    res = 1
    while num >= 1:
        res = res * num
        num -= 1
    return res

这样做的弊端就是运行速度变慢，因为我们不再使用C语言实现的阶乘函数。

第二种方法，你可以在调用C函数前休眠一下。

def calc_fact(num):
    sleep(0.001)
    math.factorial(num)

注意：这里的休眠不会影响C函数的执行，只是让主线程有机会向下执行。

多数据返回的坑

Python允许函数返回多个数据，比如下面的函数xyz就返回了2个值:

def xyz():
    return a, b

Python的这个特性很方便，当我们使用时可以用两个变量承接返回值

a, b = xyz()

但是如果用一个变量来承接多返回值，

t = xyz()

python也是允许的，只不过t的数据类型是个元组(a, b)，不是函数返回的第一个值。这里大家要格外注意。

JSON中的坑

JSON是我们日常开发中用到最多的数据类型，也是前后端传输数据最常用的数据类型。但是Python对json的处理跟javascript不同，这会让很多前端转型Python开发的同学不适应。我们看下面这个例子：

my_var = 'bla'
my_key = 'key'

params = {
   
   "language": "en", my_var: my_key}

上面的代码如果在javascript中，params的内容为：

{
   
   
    "language": "en",
    "my_var": "key"
}

而在python中，param的内容为：

{
   
   
    "language": "en",
     "bla": "key"
}

在Python中，字典中的my_var 和 api_key会被当做变量来求值。

Python避坑指南（续）

lambda的坑

链式`or`的坑

访问字面量属性的坑

`is`的坑

GIL全局锁的坑

多数据返回的坑

JSON中的坑

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Python避坑指南（续）

lambda的坑

链式or的坑

访问字面量属性的坑

is的坑

GIL全局锁的坑

多数据返回的坑

JSON中的坑

热门文章

最新文章

相关课程

相关电子书

链式`or`的坑

`is`的坑