深入理解Python中的__builtin__和__builtins__

简介:

0.说明


        这里的说明主要是以Python 2.7为例,因为在Python 3+中,__builtin__模块被命名为builtins,下面主要是探讨Python 2.x中__builtin__模块和__builtins__模块的区别和联系。




1.名称空间(Namespace)


        首先不得不说名称空间,因为名称空间是Python中非常重要的一个概念,所谓名称空间,其实指的是名称(标识符)到对象的映射。

        在一个正常的Python程序的执行过程中,至少存在两个名称空间:

  • 内建名称空间

  • 全局名称空间

        如果定义了函数,则还会有局部名称空间,全局名称空间一般由在程序的全局变量和它们对应的映射对象组成,而局部名称空间则在函数内部由函数局部变量和它们对应的映射对象组成,这里关键的是内建名称空间,它到底是怎么产生的?




2.内建函数


        在启动Python解释器之后,即使没有创建任何的变量或者函数,还是会有许多函数可以使用,比如:

1
2
3
4
>>>  abs ( - 1 )
1
>>>  max ( 1 3 )
3

        我们把这些函数称为内建函数,是因为它们不需要我们程序员作任何定义,在启动Python解释器的时候,就已经导入到内存当中供我们使用:

1
2
3
4
5
>>>  abs
<built - in  function  abs >
>>> 
>>>  max
<built - in  function  max >




3.内建名称空间与__builtins__


        那么内建函数也是函数,虽然我们没有人为导入这些,但是正如前面所说,在启动Python解释器的时候,会自动帮我们导入,那么内建函数存在于哪里呢?

        其实准确地来说,是Python解释器在启动的时候会首先加载内建名称空间,内建名称空间有许多名字到对象之间映射,而这些名字其实就是内建函数的名称,对象就是这些内建函数本身(注意区分函数名称和函数对象的区别)。这些名称空间由__builtins__模块中的名字构成:

1
2
>>>  dir ()
[ '__builtins__' '__doc__' '__name__' '__package__' ]

        可以看到有一个__builtins__的模块名称,这个模块本身定义了一个名称空间,即内建名称空间,我们不妨dir一下:

1
2
>>>  dir (__builtins__)
[ 'ArithmeticError' 'AssertionError' 'AttributeError' 'BaseException' 'BufferError' 'BytesWarning' 'DeprecationWarning' 'EOFError' 'Ellipsis' 'EnvironmentError' 'Exception' 'False' 'FloatingPointError' 'FutureWarning' 'GeneratorExit' 'IOError' 'ImportError' 'ImportWarning' 'IndentationError' 'IndexError' 'KeyError' 'KeyboardInterrupt' 'LookupError' 'MemoryError' 'NameError' 'None' 'NotImplemented' 'NotImplementedError' 'OSError' 'OverflowError' 'PendingDeprecationWarning' 'ReferenceError' 'RuntimeError' 'RuntimeWarning' 'StandardError' 'StopIteration' 'SyntaxError' 'SyntaxWarning' 'SystemError' 'SystemExit' 'TabError' 'True' 'TypeError' 'UnboundLocalError' 'UnicodeDecodeError' 'UnicodeEncodeError' 'UnicodeError' 'UnicodeTranslateError' 'UnicodeWarning' 'UserWarning' 'ValueError' 'Warning' 'ZeroDivisionError' '_' '__debug__' '__doc__' '__import__' '__name__' '__package__' 'abs' 'all' 'any' 'apply' 'basestring' 'bin' 'bool' 'buffer' 'bytearray' 'bytes' 'callable' 'chr' 'classmethod' 'cmp' 'coerce' 'compile' 'complex' 'copyright' 'credits' 'delattr' 'dict' 'dir' 'divmod' 'enumerate' 'eval' 'execfile' 'exit' 'file' 'filter' 'float' 'format' 'frozenset' 'getattr' 'globals' 'hasattr' 'hash' 'help' 'hex' 'id' 'input' 'int' 'intern' 'isinstance' 'issubclass' 'iter' 'len' 'license' 'list' 'locals' 'long' 'map' 'max' 'memoryview' 'min' 'next' 'object' 'oct' 'open' 'ord' 'pow' 'print' 'property' 'quit' 'range' 'raw_input' 'reduce' 'reload' 'repr' 'reversed' 'round' 'set' 'setattr' 'slice' 'sorted' 'staticmethod' 'str' 'sum' 'super' 'tuple' 'type' 'unichr' 'unicode' 'vars' 'xrange' 'zip' ]

        会看到我们熟悉的内建函数的名称,如list、dict等,当然还有一些异常和其它属性。




4.__builtins__与__builtin__的简单区别


        既然内建名称空间由__builtins__模块中的名称空间定义,那么是不是也意味着内建名称空间中所对应的这些函数也是在__builtins__模块中实现的呢?

        显然不是的,我们可以在解释器中直接输入__builtins__:

1
2
>>> __builtins__
<module  '__builtin__'  (built - in )>

        从结果中可以看到,__builtins__其实还是引用了__builtin__模块而已,这说明真正的模块是__builtin__,也就是说,前面提到的内建函数其实是在内建模块__builtin__中定义的,即__builtins__模块包含内建名称空间中内建名字的集合(因为它引用或者说指向了__builtin__模块),而真正的内建函数、异常和属性来自__builtin__模块。也就是说,在Python中,其实真正是只有__builtin__这个模块,并不存在__builtins__这个模块:

1
2
3
4
5
>>>  import  __builtin__
>>>  import  __builtins__
Traceback (most recent call last):
   File  "<stdin>" , line  1 in  <module>
ImportError: No module named __builtins__

        可以看到,导入__builtin__模块并没有问题,但导入__builtins__模块时就会提示不存在,这充分说明了前面的结论,现在再次总结如下:

  • 在Python中并没有__builtins__这个模块,只有__builtin__模块,__builtins__模块只是在启动Python解释器时,解释器为我们自动创建的一个到__builtin__模块的引用

        当然,至于这种引用到底是怎么样,可以看下面的深入区别。




5.__builtins__与__builtin__的深入区别


        上面只是大概说了下__builtins__与__builtin__两个模块的简单区分而已,其实深究下去,要分成下面所提及的两种情况。


(1)在主模块__main__中

        其实我们在使用Python交互器的时候就是在主模块中进行操作,可以做如下验证:

1
2
>>>  print  __name__
__main__

        在这种情况,__builtins__与__builtin__是完全一样的,它们指向的都是__builtin__这个内建模块:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
>>>  import  __builtin__
>>> __builtin__
<module  '__builtin__'  (built - in )>
>>> __builtins__
<module  '__builtin__'  (built - in )>
>>> __builtin__.__name__
'__builtin__'
>>> __builtins__.__name__
'__builtin__'
>>> __builtins__  = =  __builtin__
True
>>> __builtins__  is  __builtin__
True
>>>  id (__builtins__)
140295127423752
>>>  id (__builtin__)
140295127423752

        可以看到,这时候__builtins__和__builtin__是完全一样的,它们都指向了同一个模块对象,其实这也是Python中引用传递的概念。

        其实这种情况跟我们创建一个变量并对它做一次引用传递时的情况是一样的,可以做如下测试:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
>>>  def  func():
...      print  'test'
... 
>>> func
<function func at  0x7f99012bdc08 >
>>> funcs
<function func at  0x7f99012bdc08 >
>>> func.__name__
'func'
>>> funcs.__name__
'func'
>>> funcs  = =  func
True
>>> funcs  is  func
True
>>>  id (funcs)
140295126375432
>>>  id (func)
140295126375432

        显然,这完全验证了我们上面的结论。


(2)不是在主模块中

        如果不是在主模块中使用__builtins__,这时候,__builtins__只是对__builtin__.__dict__的一个简单引用而已,可以通过下面的测试来验证说明。

        先创建一个test.py模块,后面我们需要在Python交互器中导入它,那么这时候对于test模块来说,它就不是主模块了。如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#!/usr/bin/env python
 
import  __builtin__
 
 
print  'Module name:' , __name__
 
 
print  '*==test __builtin__ and __builtins__==*'
print  '__builtin__ == __builtins__' , __builtin__  = =  __builtins__
print  '__builtin__ is __builtins__' , __builtin__  is  __builtins__
print  'id(__builtin__)' id (__builtin__)
print  'id(__builtins__)' id (__builtins__)
 
print  '=' * 50
 
print  '*==test __builtin__.__dict__ and __builtins__==*'
print  '__builtin__.__dict__ == __builtins__' , __builtin__.__dict__  = =  __builtins__
print  '__builtin__ is __builtins__' , __builtin__.__dict__  is  __builtins__
print  'id(__builtin__)' id (__builtin__.__dict__)
print  'id(__builtins__)' id (__builtins__)

        在Python交互器中导入上面这个test模块,如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
>>>  import  test
Module name: test
* = = test __builtin__  and  __builtins__ = = *
__builtin__  = =  __builtins__  False
__builtin__  is  __builtins__  False
id (__builtin__)  140592847690504
id (__builtins__)  140592847925608
= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
* = = test __builtin__.__dict__  and  __builtins__ = = *
__builtin__.__dict__  = =  __builtins__  True
__builtin__  is  __builtins__  True
id (__builtin__)  140592847925608
id (__builtins__)  140592847925608

        可以看到输出的结果跟我们想的是完全一样的,即这时候__builtins__其实是对__builtin__.__dict__模块的引用。




6.总结


        不管怎么说,在启动Python解释器或运行一个Python程序时,内建名称空间都是从__builtins__模块中加载的,只是__builtins__本身是对Python内建模块__builtin__的引用,而这种引用又分下面两种情况:

  • 如果是在主模块__main__中,__builtins__直接引用__builtin__模块,此时模块名__builtins__与模块名__builtin__指向的都是同一个模块,即<builtin>内建模块(这里要注意变量名和对象本身的区别)

  • 如果不是在主模块中,那么__builtins__只是引用了__builtin__.__dict__

        如果需要转载本文,请注明来自香飘叶子的51cto博客

        在写本文的时候,参考了下面的文章,只是这些文章并没有给出像上面我这样的测试,链接如下:

https://docs.python.org/2/library/__builtin__.html?highlight=_builtin__#module-__builtin__

http://www.52ij.com/jishu/665.html

相关文章
|
Python
Django Practice - Use Python's builtin Logging
Django 练习 - 使用 Python Logging 模块记录日志
1264 0
|
21天前
|
人工智能 数据可视化 数据挖掘
探索Python编程:从基础到高级
在这篇文章中,我们将一起深入探索Python编程的世界。无论你是初学者还是有经验的程序员,都可以从中获得新的知识和技能。我们将从Python的基础语法开始,然后逐步过渡到更复杂的主题,如面向对象编程、异常处理和模块使用。最后,我们将通过一些实际的代码示例,来展示如何应用这些知识解决实际问题。让我们一起开启Python编程的旅程吧!
|
20天前
|
存储 数据采集 人工智能
Python编程入门:从零基础到实战应用
本文是一篇面向初学者的Python编程教程,旨在帮助读者从零开始学习Python编程语言。文章首先介绍了Python的基本概念和特点,然后通过一个简单的例子展示了如何编写Python代码。接下来,文章详细介绍了Python的数据类型、变量、运算符、控制结构、函数等基本语法知识。最后,文章通过一个实战项目——制作一个简单的计算器程序,帮助读者巩固所学知识并提高编程技能。
|
8天前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
101 80
|
27天前
|
存储 索引 Python
Python编程数据结构的深入理解
深入理解 Python 中的数据结构是提高编程能力的重要途径。通过合理选择和使用数据结构,可以提高程序的效率和质量
134 59
|
7天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
30 2
|
20天前
|
小程序 开发者 Python
探索Python编程:从基础到实战
本文将引导你走进Python编程的世界,从基础语法开始,逐步深入到实战项目。我们将一起探讨如何在编程中发挥创意,解决问题,并分享一些实用的技巧和心得。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你提供有价值的参考。让我们一起开启Python编程的探索之旅吧!
44 10
|
23天前
|
机器学习/深度学习 人工智能 Java
Python 语言:强大、灵活与高效的编程之选
本文全面介绍了 Python 编程语言,涵盖其历史、特点、应用领域及核心概念。从 1989 年由 Guido van Rossum 创立至今,Python 凭借简洁的语法和强大的功能,成为数据科学、AI、Web 开发等领域的首选语言。文章还详细探讨了 Python 的语法基础、数据结构、面向对象编程等内容,旨在帮助读者深入了解并有效利用 Python 进行编程。
|
22天前
|
机器学习/深度学习 人工智能 数据挖掘
探索Python编程的奥秘
在数字世界的海洋中,Python如同一艘灵活的帆船,引领着无数探险者穿梭于数据的波涛之中。本文将带你领略Python编程的魅力,从基础语法到实际应用,一步步揭开Python的神秘面纱。
40 12