深入理解Python中的__builtin__和__builtins__

简介:

0.说明


        这里的说明主要是以Python 2.7为例,因为在Python 3+中,__builtin__模块被命名为builtins,下面主要是探讨Python 2.x中__builtin__模块和__builtins__模块的区别和联系。




1.名称空间(Namespace)


        首先不得不说名称空间,因为名称空间是Python中非常重要的一个概念,所谓名称空间,其实指的是名称(标识符)到对象的映射。

        在一个正常的Python程序的执行过程中,至少存在两个名称空间:

  • 内建名称空间

  • 全局名称空间

        如果定义了函数,则还会有局部名称空间,全局名称空间一般由在程序的全局变量和它们对应的映射对象组成,而局部名称空间则在函数内部由函数局部变量和它们对应的映射对象组成,这里关键的是内建名称空间,它到底是怎么产生的?




2.内建函数


        在启动Python解释器之后,即使没有创建任何的变量或者函数,还是会有许多函数可以使用,比如:

1
2
3
4
>>>  abs ( - 1 )
1
>>>  max ( 1 3 )
3

        我们把这些函数称为内建函数,是因为它们不需要我们程序员作任何定义,在启动Python解释器的时候,就已经导入到内存当中供我们使用:

1
2
3
4
5
>>>  abs
<built - in  function  abs >
>>> 
>>>  max
<built - in  function  max >




3.内建名称空间与__builtins__


        那么内建函数也是函数,虽然我们没有人为导入这些,但是正如前面所说,在启动Python解释器的时候,会自动帮我们导入,那么内建函数存在于哪里呢?

        其实准确地来说,是Python解释器在启动的时候会首先加载内建名称空间,内建名称空间有许多名字到对象之间映射,而这些名字其实就是内建函数的名称,对象就是这些内建函数本身(注意区分函数名称和函数对象的区别)。这些名称空间由__builtins__模块中的名字构成:

1
2
>>>  dir ()
[ '__builtins__' '__doc__' '__name__' '__package__' ]

        可以看到有一个__builtins__的模块名称,这个模块本身定义了一个名称空间,即内建名称空间,我们不妨dir一下:

1
2
>>>  dir (__builtins__)
[ 'ArithmeticError' 'AssertionError' 'AttributeError' 'BaseException' 'BufferError' 'BytesWarning' 'DeprecationWarning' 'EOFError' 'Ellipsis' 'EnvironmentError' 'Exception' 'False' 'FloatingPointError' 'FutureWarning' 'GeneratorExit' 'IOError' 'ImportError' 'ImportWarning' 'IndentationError' 'IndexError' 'KeyError' 'KeyboardInterrupt' 'LookupError' 'MemoryError' 'NameError' 'None' 'NotImplemented' 'NotImplementedError' 'OSError' 'OverflowError' 'PendingDeprecationWarning' 'ReferenceError' 'RuntimeError' 'RuntimeWarning' 'StandardError' 'StopIteration' 'SyntaxError' 'SyntaxWarning' 'SystemError' 'SystemExit' 'TabError' 'True' 'TypeError' 'UnboundLocalError' 'UnicodeDecodeError' 'UnicodeEncodeError' 'UnicodeError' 'UnicodeTranslateError' 'UnicodeWarning' 'UserWarning' 'ValueError' 'Warning' 'ZeroDivisionError' '_' '__debug__' '__doc__' '__import__' '__name__' '__package__' 'abs' 'all' 'any' 'apply' 'basestring' 'bin' 'bool' 'buffer' 'bytearray' 'bytes' 'callable' 'chr' 'classmethod' 'cmp' 'coerce' 'compile' 'complex' 'copyright' 'credits' 'delattr' 'dict' 'dir' 'divmod' 'enumerate' 'eval' 'execfile' 'exit' 'file' 'filter' 'float' 'format' 'frozenset' 'getattr' 'globals' 'hasattr' 'hash' 'help' 'hex' 'id' 'input' 'int' 'intern' 'isinstance' 'issubclass' 'iter' 'len' 'license' 'list' 'locals' 'long' 'map' 'max' 'memoryview' 'min' 'next' 'object' 'oct' 'open' 'ord' 'pow' 'print' 'property' 'quit' 'range' 'raw_input' 'reduce' 'reload' 'repr' 'reversed' 'round' 'set' 'setattr' 'slice' 'sorted' 'staticmethod' 'str' 'sum' 'super' 'tuple' 'type' 'unichr' 'unicode' 'vars' 'xrange' 'zip' ]

        会看到我们熟悉的内建函数的名称,如list、dict等,当然还有一些异常和其它属性。




4.__builtins__与__builtin__的简单区别


        既然内建名称空间由__builtins__模块中的名称空间定义,那么是不是也意味着内建名称空间中所对应的这些函数也是在__builtins__模块中实现的呢?

        显然不是的,我们可以在解释器中直接输入__builtins__:

1
2
>>> __builtins__
<module  '__builtin__'  (built - in )>

        从结果中可以看到,__builtins__其实还是引用了__builtin__模块而已,这说明真正的模块是__builtin__,也就是说,前面提到的内建函数其实是在内建模块__builtin__中定义的,即__builtins__模块包含内建名称空间中内建名字的集合(因为它引用或者说指向了__builtin__模块),而真正的内建函数、异常和属性来自__builtin__模块。也就是说,在Python中,其实真正是只有__builtin__这个模块,并不存在__builtins__这个模块:

1
2
3
4
5
>>>  import  __builtin__
>>>  import  __builtins__
Traceback (most recent call last):
   File  "<stdin>" , line  1 in  <module>
ImportError: No module named __builtins__

        可以看到,导入__builtin__模块并没有问题,但导入__builtins__模块时就会提示不存在,这充分说明了前面的结论,现在再次总结如下:

  • 在Python中并没有__builtins__这个模块,只有__builtin__模块,__builtins__模块只是在启动Python解释器时,解释器为我们自动创建的一个到__builtin__模块的引用

        当然,至于这种引用到底是怎么样,可以看下面的深入区别。




5.__builtins__与__builtin__的深入区别


        上面只是大概说了下__builtins__与__builtin__两个模块的简单区分而已,其实深究下去,要分成下面所提及的两种情况。


(1)在主模块__main__中

        其实我们在使用Python交互器的时候就是在主模块中进行操作,可以做如下验证:

1
2
>>>  print  __name__
__main__

        在这种情况,__builtins__与__builtin__是完全一样的,它们指向的都是__builtin__这个内建模块:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
>>>  import  __builtin__
>>> __builtin__
<module  '__builtin__'  (built - in )>
>>> __builtins__
<module  '__builtin__'  (built - in )>
>>> __builtin__.__name__
'__builtin__'
>>> __builtins__.__name__
'__builtin__'
>>> __builtins__  = =  __builtin__
True
>>> __builtins__  is  __builtin__
True
>>>  id (__builtins__)
140295127423752
>>>  id (__builtin__)
140295127423752

        可以看到,这时候__builtins__和__builtin__是完全一样的,它们都指向了同一个模块对象,其实这也是Python中引用传递的概念。

        其实这种情况跟我们创建一个变量并对它做一次引用传递时的情况是一样的,可以做如下测试:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
>>>  def  func():
...      print  'test'
... 
>>> func
<function func at  0x7f99012bdc08 >
>>> funcs
<function func at  0x7f99012bdc08 >
>>> func.__name__
'func'
>>> funcs.__name__
'func'
>>> funcs  = =  func
True
>>> funcs  is  func
True
>>>  id (funcs)
140295126375432
>>>  id (func)
140295126375432

        显然,这完全验证了我们上面的结论。


(2)不是在主模块中

        如果不是在主模块中使用__builtins__,这时候,__builtins__只是对__builtin__.__dict__的一个简单引用而已,可以通过下面的测试来验证说明。

        先创建一个test.py模块,后面我们需要在Python交互器中导入它,那么这时候对于test模块来说,它就不是主模块了。如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#!/usr/bin/env python
 
import  __builtin__
 
 
print  'Module name:' , __name__
 
 
print  '*==test __builtin__ and __builtins__==*'
print  '__builtin__ == __builtins__' , __builtin__  = =  __builtins__
print  '__builtin__ is __builtins__' , __builtin__  is  __builtins__
print  'id(__builtin__)' id (__builtin__)
print  'id(__builtins__)' id (__builtins__)
 
print  '=' * 50
 
print  '*==test __builtin__.__dict__ and __builtins__==*'
print  '__builtin__.__dict__ == __builtins__' , __builtin__.__dict__  = =  __builtins__
print  '__builtin__ is __builtins__' , __builtin__.__dict__  is  __builtins__
print  'id(__builtin__)' id (__builtin__.__dict__)
print  'id(__builtins__)' id (__builtins__)

        在Python交互器中导入上面这个test模块,如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
>>>  import  test
Module name: test
* = = test __builtin__  and  __builtins__ = = *
__builtin__  = =  __builtins__  False
__builtin__  is  __builtins__  False
id (__builtin__)  140592847690504
id (__builtins__)  140592847925608
= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =
* = = test __builtin__.__dict__  and  __builtins__ = = *
__builtin__.__dict__  = =  __builtins__  True
__builtin__  is  __builtins__  True
id (__builtin__)  140592847925608
id (__builtins__)  140592847925608

        可以看到输出的结果跟我们想的是完全一样的,即这时候__builtins__其实是对__builtin__.__dict__模块的引用。




6.总结


        不管怎么说,在启动Python解释器或运行一个Python程序时,内建名称空间都是从__builtins__模块中加载的,只是__builtins__本身是对Python内建模块__builtin__的引用,而这种引用又分下面两种情况:

  • 如果是在主模块__main__中,__builtins__直接引用__builtin__模块,此时模块名__builtins__与模块名__builtin__指向的都是同一个模块,即<builtin>内建模块(这里要注意变量名和对象本身的区别)

  • 如果不是在主模块中,那么__builtins__只是引用了__builtin__.__dict__

        如果需要转载本文,请注明来自香飘叶子的51cto博客

        在写本文的时候,参考了下面的文章,只是这些文章并没有给出像上面我这样的测试,链接如下:

https://docs.python.org/2/library/__builtin__.html?highlight=_builtin__#module-__builtin__

http://www.52ij.com/jishu/665.html

相关文章
|
Python
Django Practice - Use Python's builtin Logging
Django 练习 - 使用 Python Logging 模块记录日志
1264 0
|
16天前
|
存储 数据挖掘 开发者
Python编程入门:从零到英雄
在这篇文章中,我们将一起踏上Python编程的奇幻之旅。无论你是编程新手,还是希望拓展技能的开发者,本教程都将为你提供一条清晰的道路,引导你从基础语法走向实际应用。通过精心设计的代码示例和练习,你将学会如何用Python解决实际问题,并准备好迎接更复杂的编程挑战。让我们一起探索这个强大的语言,开启你的编程生涯吧!
|
22天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
22天前
|
机器学习/深度学习 数据挖掘 Python
Python编程入门——从零开始构建你的第一个程序
【10月更文挑战第39天】本文将带你走进Python的世界,通过简单易懂的语言和实际的代码示例,让你快速掌握Python的基础语法。无论你是编程新手还是想学习新语言的老手,这篇文章都能为你提供有价值的信息。我们将从变量、数据类型、控制结构等基本概念入手,逐步过渡到函数、模块等高级特性,最后通过一个综合示例来巩固所学知识。让我们一起开启Python编程之旅吧!
|
22天前
|
存储 Python
Python编程入门:打造你的第一个程序
【10月更文挑战第39天】在数字时代的浪潮中,掌握编程技能如同掌握了一门新时代的语言。本文将引导你步入Python编程的奇妙世界,从零基础出发,一步步构建你的第一个程序。我们将探索编程的基本概念,通过简单示例理解变量、数据类型和控制结构,最终实现一个简单的猜数字游戏。这不仅是一段代码的旅程,更是逻辑思维和问题解决能力的锻炼之旅。准备好了吗?让我们开始吧!
|
9天前
|
Python
Python编程入门:从零开始的代码旅程
本文是一篇针对Python编程初学者的入门指南,将介绍Python的基本语法、数据类型、控制结构以及函数等概念。文章旨在帮助读者快速掌握Python编程的基础知识,并能够编写简单的Python程序。通过本文的学习,读者将能够理解Python代码的基本结构和逻辑,为进一步深入学习打下坚实的基础。
|
13天前
|
数据采集 存储 数据处理
Python中的多线程编程及其在数据处理中的应用
本文深入探讨了Python中多线程编程的概念、原理和实现方法,并详细介绍了其在数据处理领域的应用。通过对比单线程与多线程的性能差异,展示了多线程编程在提升程序运行效率方面的显著优势。文章还提供了实际案例,帮助读者更好地理解和掌握多线程编程技术。
|
15天前
|
存储 人工智能 数据挖掘
Python编程入门:打造你的第一个程序
本文旨在为初学者提供Python编程的初步指导,通过介绍Python语言的基础概念、开发环境的搭建以及一个简单的代码示例,帮助读者快速入门。文章将引导你理解编程思维,学会如何编写、运行和调试Python代码,从而开启编程之旅。
35 2
|
16天前
|
存储 Python
Python编程入门:理解基础语法与编写简单程序
本文旨在为初学者提供一个关于如何开始使用Python编程语言的指南。我们将从安装Python环境开始,逐步介绍变量、数据类型、控制结构、函数和模块等基本概念。通过实例演示和练习,读者将学会如何编写简单的Python程序,并了解如何解决常见的编程问题。文章最后将提供一些资源,以供进一步学习和实践。
29 1