带你重温一下 Python 的对象模型

简介: 带你重温一下 Python 的对象模型

在面向对象的理论中,有两个核心的概念:类和实例。类可以看成是一个模板,实例就是根据这个模板创建出来的对象。但在 Python 里面,类和实例都是对象,也就是所谓的类对象(或者类型对象)和实例对象。

为了避免后续出现歧义,我们这里把对象分为三种:

  • 内置类对象:比如 int、str、list、type、object 等等;
  • 自定义类对象:通过 class 关键字定义的类,当然我们也会把它和上面的内置类对象统称为类对象(或者类型对象);
  • 实例对象:由类对象(内置类对象或自定义类对象)创建的实例;

而对象之间存在以下两种关系:

  • is-kind-of:对应面向对象理论中子类和父类之间的关系;
  • is-instance-of:对应面向对象理论中实例对象和类对象之间的关系;

我们举例说明:

class Girl(object):
    def say(self):
        return "古明地觉"
girl = Girl()
print(girl.say())  # 古明地觉

这段代码便包含了上面的三种对象:object(内置类对象),Girl(自定义类对象),girl(实例对象)。

显然 Girl 和 object 之间是 is-kind-of 关系,即 Girl 是 object 的子类。值得一提的是,Python3 里面所有的类(除 object)都是默认继承自 object,即便我们这里不显式继承 object,也会默认继承的,但为了说明,我们就写上了。

除了 Girl 是 object 的子类,我们还能看出 girl 和 Girl 之间存在 is-instance-of 关系,即 girl 是 Girl 的实例。当然如果再进一步的话,girl 和 object 之间也存在 is-instance-of 关系,girl 也是 object 的实例。

class Girl(object):
    pass
    
girl = Girl()
print(issubclass(Girl, object))  # True 
print(type(girl))  # <class '__main__.Girl'>
print(isinstance(girl, Girl))  # True
print(isinstance(girl, object))  # True

girl 是 Girl 这个类实例化得到的,所以 type(girl) 得到的是类对象 Girl。但 girl 也是 object 的实例对象,因为 Girl 继承了 object。至于这其中的原理,我们会慢慢介绍。


Python 也提供了一些手段可以探测这些关系,除了上面的 type 之外,还可以使用对象的 __class__ 属性探测一个对象和其它的哪些对象之间存在 is-instance-of 关系。


而通过对象的 __bases__ 属性则可以探测一个对象和其它的哪些对象之间存在着 is-kind-of 关系。此外 Python 还提供了两个函数 issubclass 和 isinstance 来验证两个对象之间是否存在着我们期望的关系。

class Girl(object):
    pass 
girl = Girl()
print(girl.__class__)  # <class '__main__.Girl'>
print(Girl.__class__)  # <class 'type'>
# __class__是查看自己的类型是什么,也就是生成自己的类
# 而在介绍 Python 对象的时候,我们就看到了
# 任何一个对象都至少具备两个东西: 一个是引用计数、一个是类型
# 所以 __class__ 是所有对象都具备的
# __base__只显示直接继承的第一个类
print(Girl.__base__)  # <class 'object'>
# __bases__ 会显示直接继承的所有类,以元组的形式
print(Girl.__bases__)  # (<class 'object'>,)

我们画一张图总结一下:


a606b8ab5d4419b263d2d66f2b30c1dc.png


另外需要注意里面的 type 和 object:


  • type 和 object 存在 is-kind-of 关系,因为 type 是 object 的子类;
  • object 和 type 存在 is-instance-of 关系,因为 object 是 type 的实例对象;


可能有人会好奇为什么会是这样,而关于这一点,我在 type 与 object 的恩怨纠葛这篇文章讲得很详细了,感兴趣可以点击阅读一下。

简单来说就是,type 在底层对应的结构体为 PyType_Type、object 在底层对应的结构体为 PyBaseObject_Type。而在创建 object 的时候,将内部的 ob_type 设置成了&PyType_Type;在创建type的时候,将内部的 tp_base 设置成了&PyBaseObject_Type。

因此这两者的定义是彼此依赖的,两者是同时出现的,我们后面还会看到。

另外 type 的类型就是 type 本身,所以:

  • 实例对象的类型是类型对象,类型对象的类型是元类;
  • 所有类型对象的基类都收敛于 object
  • 所有对象的类型都收敛于 type;

5610776f3fd371f9668a0e6b948e74df.png

因此 Python 算是将一切皆对象的理念贯彻到了极致,也正因为如此,Python 才具有如此优秀的动态特性。

但还没有结束,我们看一下类对象 Girl 的行为,首先它支持属性设置:

class Girl(object):
    pass
print(hasattr(Girl, "name"))  # False
Girl.name = "古明地觉"
print(hasattr(Girl, "name"))  # True
print(Girl.name)  # 古明地觉

一个类都已经定义完了,我们后续还可以进行属性添加,这在其它的静态语言中是不可能做到的。那么Python是如何做到的呢?我们说能够对属性进行动态添加,你会想到什么?是不是字典呢?

正如 global 名字空间一样,我们猜测类应该也有自己的属性字典,往类里面设置属性的时候,等价于向字典中添加键值对,同理其它操作也与之类似。

class Girl(object):
    pass
print(Girl.__dict__.get("name", "不存在"))  # 不存在
Girl.name = "古明地觉"
print(Girl.__dict__.get("name"))  # 古明地觉

和操作全局变量是类似的,但是有一点需要注意:我们不能直接通过类的属性字典来设置属性。

try:
    Girl.__dict__["name"] = "古明地觉"
except Exception as e:
    print(e)  
# 'mappingproxy' object does not support item assignment

虽然叫属性字典,但其实是 mappingproxy 对象,该对象本质上就是对字典进行了一层封装,在字典的基础上移除了增删改操作,也就是只保留了查询功能。如果我们想给类增加属性,可以采用直接赋值的方式,或者调用 setattr 函数也是可以的。

但在介绍如何篡改虚拟机的时候,我们提到过一个骚操作,可以通过 gc 模块拿到 mappingproxy 对象里的字典。

import gc
class Girl(object):
    pass
gc.get_referents(Girl.__dict__)[0]["name"] = "古明地觉"
print(Girl.name)  # 古明地觉

并且这种做法除了适用于自定义类对象,还适用于内置类对象。但是工作中不要这么做,知道有这么个操作就行。

除了设置属性之外,我们还可以设置函数。

class Girl(object):
    pass
Girl.info = lambda name: f"我是{name}"
print(Girl.info("古明地觉"))  # 我是古明地觉
# 如果实例调用的话,会和我们想象的不太一样
# 因为实例调用的话会将函数包装成方法
try:
    Girl().info("古明地觉")
except TypeError as e:
    print(e) 
"""
<lambda>() takes 1 positional argument but 2 were given
"""    
# 实例在调用的时候会将自身也作为参数传进去
# 所以第一个参数 name 实际上接收的是 Girl 的实例对象
# 只不过第一个参数按照规范来讲应该叫做self
# 但即便你起别的名字也是无所谓的
print(Girl().info())  
"""
我是<__main__.Girl object at 0x000001920BB88760>
"""

所以我们可以有两种做法:

# 将其包装成一个静态方法
# 这样类和实例都可以调用
Girl.info = staticmethod(lambda name: f"我是{name}")
print(Girl.info("古明地觉"))  # 我是古明地觉
print(Girl().info("古明地觉"))  # 我是古明地觉
# 如果是给实例用的,那么带上一个 self 参数即可
Girl.info = lambda self, name: f"我是{name}"
print(Girl().info("古明地觉"))  # 我是古明地觉

此外我们还可以通过 type 来动态地往类里面进行属性的增加、修改和删除。

class Girl(object):
    def say(self):
        pass
print(hasattr(Girl, "say"))  # True
# delattr(Girl, "say") 与之等价
type.__delattr__(Girl, "say")
print(hasattr(Girl, "say"))  # False
# 我们设置一个属性吧
# 等价于 Girl.name = "古明地觉"
setattr(Girl, "name", "古明地觉")
print(Girl.name)  # 古明地觉

事实上调用 getattr、setattr、delattr 等价于调用其类型对象的__getattr__、__setattr__、__delattr__。

所以,一个对象支持哪些行为,取决于其类型对象定义了哪些操作。并且通过对象的类型对象,可以动态地给该对象进行属性的设置。Python 所有类型对象的类型对象都是 type,通过 type 我们便可以控制类的生成过程,即便类已经创建完毕了,也依旧可以进行属性设置。


但是注意:type 可以操作的类只能是通过 class 定义的动态类,而像 int、list、dict 等静态类,它们是在源码中静态定义好的,只不过类型设置成了 type。一言以蔽之,type 虽然是所有类对象的类对象,但 type 只能对动态类进行属性上的修改,不能修改静态类。

try:
    int.name = "古明地觉"
except Exception as e:
    print(e)
"""
can't set attributes of built-in/extension type 'int'
"""
try:
    setattr(int, "ping", "pong")
except Exception as e:
    print(e)
"""
can't set attributes of built-in/extension type 'int'     
"""

通过报错信息可以看到,不可以设置内置类和扩展类的属性,因为内置类在解释器启动之后,就已经初始化好了。至于扩展类就是我们使用 Python/C API 编写的扩展模块中的类,它和内置类是等价的。


因此内置类和使用 class 定义的类本质上是一样的,都是 PyTypeObject 对象,它们的类型在 Python 里面都是 type。但区别在于内置类在底层是静态初始化的,我们不能进行属性的动态设置(通过 gc 模块实现除外)。


但是为什么不可以对内置类和扩展类进行属性设置呢?首先我们要知道 Python 的动态特性是虚拟机赐予的,而虚拟机的工作就是将 PyCodeObject 对象翻译成 C 的代码进行执行,所以 Python 的动态特性就是在这一步发生的。

而内置类在解释器启动之后就已经静态初始化好了,直接指向 C 一级的数据结构,同理扩展类也是如此。它们相当于绕过了解释执行这一步,所以它们的属性不可以动态添加。

不光内置的类本身,还有它的实例对象也是如此。

a = 123
print(hasattr(a, "__dict__"))  # False

我们看到它连自己的属性字典都没有,因为内置类对象的实例对象,内部有哪些属性,解释器记得清清楚楚。它们在底层都已经写死了,并且不允许修改,因此虚拟机完全没有必要为其实现属性字典(节省了内存占用)。

相关文章
|
21天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
17天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2563 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
15天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
13天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
17天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1556 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
19天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
826 14
|
14天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
621 7
|
7天前
|
Docker 容器
Docker操作 (五)
Docker操作 (五)
170 69
|
7天前
|
Docker 容器
Docker操作 (三)
Docker操作 (三)
167 69
|
19天前
|
人工智能 自动驾驶 机器人
吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界
过去22个月,AI发展速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
629 52
吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界