深度解析Python的赋值、浅拷贝、深拷贝

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 直接赋值: 其实就是指向对象的引用(别名)。浅拷贝(copy):拷贝父对象,不会拷贝对象的内部的子对象。但对于不可变数据类型,不会拷贝,仅仅是指向深拷贝(deepcopy):`copy` 模块的 `deepcopy` 方法,完全拷贝了父对象及其子对象。拷贝 就是把原数据复制一份,在复制的数据上随意改动不会影响到其原数据。也就是这里讲的深拷贝。

简述

  • 直接赋值: 其实就是指向对象的引用(别名)。
  • 浅拷贝(copy): 拷贝父对象,不会拷贝对象的内部的子对象。但对于不可变数据类型,不会拷贝,仅仅是指向
  • 深拷贝(deepcopy): copy 模块的 deepcopy 方法,完全拷贝了父对象及其子对象。

拷贝 就是把原数据复制一份,在复制的数据上随意改动不会影响到其原数据。也就是这里讲的深拷贝。

<br/>

直接赋值


In [1]: a = [11, 22, 33]

In [2]: b = a

In [3]: b
Out[3]: [11, 22, 33]

In [4]: id(a), id(b)
Out[4]: (2053851155016, 2053851155016)

In [5]: c = {"name": "hui"}

In [6]: d = c

In [7]: id(c), id(d)
Out[7]: (2053851035112, 2053851035112)

    
In [8]: a.append(44)

In [9]: a
Out[9]: [11, 22, 33, 44]

In [10]: b
Out[10]: [11, 22, 33, 44]

In [11]: c["age"] = 21

In [12]: c
Out[12]: {'name': 'hui', 'age': 21}

In [13]: d
Out[13]: {'name': 'hui', 'age': 21}

可以看到当给一个变量直接赋值时,其实就是将对象引用复制了一份,所以 id() 取得内存地址都一样,它们指向的都是同一个对象。画张图就好理解。

直接赋值

<br/>

浅拷贝

利用内置模块 copy 实现浅拷贝

In [12]: a = [1, 2]

In [13]: b = [3, 4]

In [14]: c = [a, b]

In [15]: d = c

In [16]: id(c),          id(d)
Out[16]: (1409068540040, 1409068540040)

In [17]: import copy

In [18]: e = copy.copy(c)

In [19]: id(c),          id(d),         id(e)
Out[19]: (1409068540040, 1409068540040, 1409070776520) 
# 浅拷贝copy的对象id()不一样

In [20]: id(c[0]), id(c[1])
Out[20]: (1409071493512, 1409071679112)

In [21]: id(e[0]), id(e[1])
Out[21]: (1409071493512, 1409071679112)
# 其子对象则一样

In [22]: a.append(5)

In [23]: b.append(6)

In [24]: c
Out[24]: [[1, 2, 5], [3, 4, 6]]

In [25]: d
Out[25]: [[1, 2, 5], [3, 4, 6]]

In [26]: e
Out[26]: [[1, 2, 5], [3, 4, 6]]
# 内容一致
    
In [28]: c.append(7)

In [29]: c
Out[29]: [[1, 2, 5], [3, 4, 6], 7]

In [30]: e
Out[30]: [[1, 2, 5], [3, 4, 6]]

可以看出直接赋值 cd 是同一对象,而浅拷贝 copyce 是一个分别独立的对象,但他们的子对象 a , b 还是 指向统一对象即引用

因此当 c.append(7) 后,只有 c 对象改变了,而浅拷贝的 e 还是没有变化。

a.append(5), b.append(6) 后,c, d, e 对象依然内容一致。

直接赋值与浅拷贝对比

<br/>

深拷贝

通过 copy.deepcopy() 来实现深拷贝

In [33]: a = [1, 2]

In [34]: b = [3, 4]

In [35]: c = [a, b]

In [36]: d = copy.deepcopy(c)

In [37]: id(c), id(d)
Out[37]: (1409071919752, 1409071607112)

In [38]: id(c[0]), id(c[1])
Out[38]: (1409071948680, 1409071766216)

In [39]: id(d[0]), id(d[1])
Out[39]: (1409071976328, 1409071919880)
# 完全拷贝了,其子对象的id()都不一样

In [40]: c.append(5)

In [41]: c
Out[41]: [[1, 2], [3, 4], 5]

In [42]: d
Out[42]: [[1, 2], [3, 4]]

In [43]: a.append(3)

In [44]: b.append(5)

In [45]: c
Out[45]: [[1, 2, 3], [3, 4, 5], 5]

In [46]: d
Out[46]: [[1, 2], [3, 4]]
# 因此任c怎么修改,都影响不到d

In [47]: d[0].append(5)

In [48]: d[1].append(6)

In [49]: d
Out[49]: [[1, 2, 5], [3, 4, 6]]

In [50]: d.append(7)

In [51]: d
Out[51]: [[1, 2, 5], [3, 4, 6], 7]

In [52]: c
Out[52]: [[1, 2, 3], [3, 4, 5], 5]
# d怎么修改也影响不到c

深度拷贝, 完全拷贝了父对象及其子对象,两者是完全独立的。因此 c,d 做任何操作都互不影响。

深拷贝

<br/>

三者对比

  • d = c 赋值引用,cd 都指向同一个对象
  • e = c.copy() 浅拷贝,ce 是一个 独立的对象,但他们的 子对象还是指向统一对象即引用
  • f = copy.deepcopy(c) 深度拷贝,c f 完全拷贝了父对象及其子对象,两者是完全独立的

深浅拷贝理解图1

<br/>

拷贝对可变类型和不可变类型的区别

  • copy.copy() 对于可变类型,会进行浅拷贝。
  • copy.copy() 对于不可变类型,不会拷贝,仅仅是指向。
  • copy.deepcopy() 深拷贝对可变、不可变类型都一样递归拷贝所有,对象完全独立

<br/>

所谓的不可变指的是所指向的内存中的内容不可变。

同一份内存地址,其内容发生了改变,但地址依旧不变。说明是可变数据类型例如 list, set, dict

数据类型 是否可变
整型 不可变
字符串 str 不可变
元组 tuple 不可变
列表 list 可变
集合 set 可变
字典 dict 可变

<br/>

不可变数据类型测试

In [15]: a = 5
​
In [16]: id(a)
Out[16]: 140712197127360
​
In [17]: a = 6
​
In [18]: id(a)
Out[18]: 140712197127392
    

首先 a=5,地址为 140712197127360,当我让 a=6 把里面值改变时,它并不是说把 a地址 里面值从 5 改成 6, 而是说又开辟了一块新的内存地址140712197127392 里面存储 6,然后让 a 指向 6 的那份内存地址。所以称 a 这种数据类型为不可变数据类型

可变数据类型更改图示

可变数据类型测试

In [31]: li = [1, 2, 3]
​
In [32]: id(li)
Out[32]: 2365035049224
​
In [33]: li[0] = 5
​
In [34]: li
Out[34]: [5, 2, 3]
​
In [35]: id(li)
Out[35]: 2365035049224

li 首先存储了 [1, 2, 3], 后来变成了 [5, 2, 3],但 li 的地址依旧不变,因此称 li 这种数据类型为 可变数据类型

<br/>

浅拷贝测试

In [54]: # 可变类型list

In [55]: a = [1, 2, 3]

In [56]: b = copy.copy(a)

In [57]: id(a)
Out[57]: 1409069563528

In [58]: id(b)
Out[58]: 1409071719752

In [59]: a.append(4)

In [60]: a
Out[60]: [1, 2, 3, 4]

In [61]: b
Out[61]: [1, 2, 3]

In [63]: # 不可变类型 tuple

In [64]: c = (1, 2, 3)

In [65]: d = copy.copy(c)

In [66]: id(c)
Out[66]: 1409070834456

In [67]: id(d)
Out[67]: 1409070834456

当浅拷贝 copy() 不可变类型元组时 tuplec, d的内存地址都一样,说明仅是指向。

<br/>

深拷贝测试

In [71]: a = ([1, 2], [3, 4])

In [72]: b = copy.copy(a)

In [73]: c = copy.deepcopy(a)

In [74]: id(a)
Out[74]: 1409068519944

In [75]: id(b)
Out[75]: 1409068519944
# 浅拷贝不可变类型id()一致

In [76]: id(c)
Out[76]: 1409071533448
# 深拷贝不可变类型id()不一致

In [77]: b[0].append(3)

In [78]: b[1].append(5)

In [79]: a
Out[79]: ([1, 2, 3], [3, 4, 5])

In [80]: b
Out[80]: ([1, 2, 3], [3, 4, 5])

In [81]: c
Out[81]: ([1, 2], [3, 4])
# 浅拷贝的子对象引用一致

In [82]: c[0].append(3)

In [83]: c
Out[83]: ([1, 2, 3], [3, 4])

In [84]: b
Out[84]: ([1, 2, 3], [3, 4, 5])

In [85]: a
Out[85]: ([1, 2, 3], [3, 4, 5])
# 深拷贝则是完全拷贝,互不影响

copy.deepcopy() 深拷贝对可变、不可变类型都一样递归拷贝所有,对象完全独立。

深浅拷贝理解图2

<br/>

公众号

新建文件夹X

大自然用数百亿年创造出我们现实世界,而程序员用几百年创造出一个完全不同的虚拟世界。我们用键盘敲出一砖一瓦,用大脑构建一切。人们把1000视为权威,我们反其道行之,捍卫1024的地位。我们不是键盘侠,我们只是平凡世界中不凡的缔造者 。
相关文章
|
7天前
|
测试技术 开发者 Python
深入浅出:Python中的装饰器解析与应用###
【10月更文挑战第22天】 本文将带你走进Python装饰器的世界,揭示其背后的魔法。我们将一起探索装饰器的定义、工作原理、常见用法以及如何自定义装饰器,让你的代码更加简洁高效。无论你是Python新手还是有一定经验的开发者,相信这篇文章都能为你带来新的启发和收获。 ###
8 1
|
7天前
|
设计模式 测试技术 开发者
Python中的装饰器深度解析
【10月更文挑战第24天】在Python的世界中,装饰器是那些能够为函数或类“添彩”的魔法工具。本文将带你深入理解装饰器的概念、工作原理以及如何自定义装饰器,让你的代码更加优雅和高效。
|
17天前
|
XML 前端开发 数据格式
Beautiful Soup 解析html | python小知识
在数据驱动的时代,网页数据是非常宝贵的资源。很多时候我们需要从网页上提取数据,进行分析和处理。Beautiful Soup 是一个非常流行的 Python 库,可以帮助我们轻松地解析和提取网页中的数据。本文将详细介绍 Beautiful Soup 的基础知识和常用操作,帮助初学者快速入门和精通这一强大的工具。【10月更文挑战第11天】
48 2
|
16天前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
19天前
|
Web App开发 SQL 数据库
使用 Python 解析火狐浏览器的 SQLite3 数据库
本文介绍如何使用 Python 解析火狐浏览器的 SQLite3 数据库,包括书签、历史记录和下载记录等。通过安装 Python 和 SQLite3,定位火狐数据库文件路径,编写 Python 脚本连接数据库并执行 SQL 查询,最终输出最近访问的网站历史记录。
|
20天前
|
机器学习/深度学习 算法 Python
深度解析机器学习中过拟合与欠拟合现象:理解模型偏差背后的原因及其解决方案,附带Python示例代码助你轻松掌握平衡技巧
【10月更文挑战第10天】机器学习模型旨在从数据中学习规律并预测新数据。训练过程中常遇过拟合和欠拟合问题。过拟合指模型在训练集上表现优异但泛化能力差,欠拟合则指模型未能充分学习数据规律,两者均影响模型效果。解决方法包括正则化、增加训练数据和特征选择等。示例代码展示了如何使用Python和Scikit-learn进行线性回归建模,并观察不同情况下的表现。
179 3
|
22天前
|
运维 安全 网络协议
Python 网络编程:端口检测与IP解析
本文介绍了使用Python进行网络编程的两个重要技能:检查端口状态和根据IP地址解析主机名。通过`socket`库实现端口扫描和主机名解析的功能,并提供了详细的示例代码。文章最后还展示了如何整合这两部分代码,实现一个简单的命令行端口扫描器,适用于网络故障排查和安全审计。
|
5月前
|
XML JavaScript 关系型数据库
Python XML 解析
Python XML 解析
|
6月前
|
XML JavaScript API
Python XML 解析
Python XML 解析
|
XML JavaScript 关系型数据库