哈喽大家好,我是咸鱼。
前天有个小伙伴找到我,给了我一段 python 代码:
a = [1, 2]
a[1] = a
print(a[1])
然后问我为什么结果是 [1, [...]]
,我一看这个问题有意思,我说三言两语解释不清楚,我写篇文章到时候你看下吧,于是有了今天这篇文章。
在正式开始之前,让我们先弄清楚一些概念。
对象?变量?引用?赋值?
"Python 中一切皆对象",相信这句话大家在学习 Python 的时候都已经听的耳朵起茧子了吧。
在 Python 中,所有的数据都是对象,包括基本数据类型(例如整数、浮点数、字符串等)以及用户自定义的类型(类的实例等)。
而对象其实是内存中分配的一块空间,用来存储其值。每个对象都有一个唯一的标识符(id),可以通过 id()
函数获取。
不但如此,每一个对象都具有两个标准的头部信息:
- 类型标志符(Type Identifier): 每个对象都有一个类型信息,可以通过
type()
函数获取。 - 引用计数器(Reference Counter): 引用计数器表示有多少个引用指向该对象,当引用计数降为零时,对象会被垃圾回收。( Python 也使用其他垃圾回收机制,例如循环垃圾回收器来处理引用环的情况。)
在 Python 中,变量实际上是对象的【引用】,而不是对象本身的【存储】。当我们执行赋值语句时,会自动建立变量和对象之间的关系,即引用。
变量就像是一个指针,【指向】内存中存储对象的位置。
我们来看一个例子:
a = 1
b = a
a = a + 1
首先将 1
赋值于 a
,即 a
指向了 1
这个对象。
接着 b = a
则表示让变量 b
也同时指向 1
这个对象。Python 的对象可以被多个变量所指向(引用)。
最后执行 a = a + 1
,在这里需要注意的是,Python 的基础数据类型(例如整型(int)、字符串(string)等)是不可变的
所以,a = a + 1
,并不是让 a
的值增加 1
,而是表示重新创建了一个新的值为 2
的对象,并让 a
指向它。但是 b
仍然不变,仍然指向 1
这个对象。
因此最后的结果是,a
的值变成了 2
,而 b
的值不变仍然是 1
。
通过这个例子你可以看到,这里的 a
和 b
,开始只是两个指向同一个对象的变量而已,或者你也可以把它们想象成同一个对象的两个名字。
简单的赋值 b = a,并不表示重新创建了新对象,只是让同一个对象被多个变量指向或引用。
为什么?
在了解了变量、对象、引用、赋值之后,我们回到一开始的例子。
a = [1, 2]
a[1] = a
print(a[1])
这段代码中创建了一个列表 a
,其中包含两个元素(1 和 2),然后 a[1]
被赋值为整个列表 a
(a[1] = a
),当你打印 a[1]
时,它实际上是指向列表 a
本身。
a = [1, <reference to a>]
这样就会导致循环引用的问题。
我们来分步骤解释一下这个过程:
a
是一个包含两个元素的列表:[1, 2]
。a[1] = a
将列表a
的第二个元素设为a
,即a[1]
实际上指向列表a
本身,形成了一个循环引用- 当打印
a[1]
时,Python 发现这是一个特殊的情况,即这个元素是对列表本身的引用。为了避免无限循环,Python 会显示...
,表示引用已经进入了一个循环。因此看到的结果是[1, [...]]
。
那如何避免循环引用呢?可以使用浅拷贝或者深拷贝来解决。
我们用浅拷贝来试一下:
import copy
a = [1, 2]
a[1] = copy.copy(a)
print(a[1])
# 结果是[1,2]
浅拷贝创建一个新的对象,然后将原始对象中的元素复制到新对象中。但是,如果原始对象的元素是可变对象(例如列表),那么浅拷贝只会复制对象的引用而不是对象本身。
就比如上面的例子:
a = [1, 2]
创建了一个列表a
,其中有两个元素 1 和 2。a[1] = copy.copy(a)
将列表a
的第二个元素修改为对列表a
的浅拷贝。- 打印
a[1]
,此时a[1]
指向了新的对象[1, 2]
关于浅拷贝深拷贝的内容咸鱼后期再写篇文章介绍一下!