Python中import模块导入的实现原理

简介: Python中import模块导入的实现原理

什么是模块

一个.py文件就是一个模块,即Module。

模块分为三种:python标准库、第三方模块、应用程序自定义模块。

  • import语句 – 导入模块
  • Directory – 文件夹(空的)
  • Package – 比文件夹多了一个__init__.py
"""
file: cal.py
"""
def add(x, y)
  return x+y
def sub(x, y)
  return x-y
print(‘hello cal’)
"""
file: test.py
"""
import cal 
print(cal.add(1, 2))

import做了什么?

import导入模块的时候,首先会把导入的文件执行一遍,比如说我们运行test.py的时候,print(‘hello cal’)也会被执行,因为import cal的时候就把cal.py运行了一遍。所以,我们在模块文件中只写功能(也就是函数),而不要写可执行的语句。

  • 执行被引入的py文件,即使只引入一个变量(from cal import add
    ),也会运行整个文件。
  • 引入变量名 → 文件名变量

引入多个模块

import cal, time

只引入一个方法

# 只引入一个方法
from cal import add
print(add(1, 2)) #可以直接使用add,不用加cal.

引入所有方法,不推荐使用,你并不知道都引入了哪些变量,可能会出现本文件变量与引入变量名字重复的情况。

#引入所有方法 – 不推荐使用,你并不知道都引入了哪些变量,可能会出现本文件变量与引入变量名字重复的情况。
from cal import *
#新的变量名会覆盖旧的变量名
#+++++++++++++++++++++++++++
from cal import *
def add(x, y)
  return x+y+100
print(add(1, 2))
#+++++++++++++++++++++++++++
def add(x, y)
  return x+y+100
from cal import *
print(add(1, 2))
#+++++++++++++++++++++++++++

import搜索路径

import sys
print(sys.path) #查看路径

path中包含python自己定义的路径,以及当前执行的py文件的路径,也就是说当前执行路径会被自动加入到sys.path中,import就是按照这些路径去搜索被引入的变量的。

也可以通过手动添加路径

from path import cal
#path就是cal所在的路径

import导入模块的原理

首先import会根据路径找到文件,根据路径找到模块后把模块加载到内存中执行一遍,执行的时候是把模块的内容拷贝到当前文件执行。import导入是将模块从磁盘中把磁盘文件导入到内存中,这个速度是比较慢的,实际上,在导入时会有一个导入缓存,同一个模块在导入第一次的时候会有一个缓存,以后再导入都是用的缓存的导入,所以有时候你可能遇到这样的问题,被导入的文件已经删除了,但是程序还是能运行,这是因为程序使用的是缓存的导入模块。

from path import mode,它相当于把路径进行了一次拼接path\mode.py,这是from的工作。

路径拼接是在当前执行文件的路径基础上进行拼接。

当引入了很多模块的时候,一个目录下会有很多py文件,一般把bin.py作为要执行的文件,也就是整个程序的入口。而逻辑主文件叫做main.py,这里面包含了程序的主要逻辑,其他功能都放到其它文件中作为一个模块。我们在运行的时候,运行bin.py,由bin.py去调用main.py中的主逻辑。也就是说只有bin是可执行的,其余文件都不应作为执行文件。

前面说过,sys.path中只会加入当前运行程序所在的路径,bin.py是整个程序的运行文件,也就是说sys.path中只会加入bin.py的路径,假如说文件有如下导入关系

假如说main.py和cal.py在同一级目录,那么不用加路径即可导入,但是如果bin.py和这两个文件不在同一级目录(比如在上一级目录),那么bin.py导入main.py的时候就要加上main.py的路径,但是这样在执行的时候会报错,因为bin.py间接导入了cal.py,并且bin.py只加了main.py的路径而没有加cal.py的路径,前面说过sys.py只会包含当前运行路径,也就是bin.py的路径。

解决方法有两个:

  • 在main.py中加上cal.py的路径from path import cal;
  • 把路径加到sys.path中;

file 获取当前文件名

os.path.dirname(__file__)  #获取当前文件路径
os.path.dirname(os.path.dirname(__file__))  #获取当前文件的上一级路径

pycharm会自己根据当前文件名获取绝对路径,并把绝对路径通过os.path.dirname()返回给我们os.path.dirname(file),但是在终端运行的时候,终端并没有这个功能,我们需要自己去找到绝对路径,然后根据绝对路径找到文件名,并反推出上一级目录。

p = os.path.dirname(__file__) #获取当前文件的绝对路径
BASEDIR = os.path.dirname(os.path.dirname(p))
sys.psth.append(BASEDIR)

实际上,这三步的操作相当于把当前运行文件的上一级目录通过相对路径的方式添加到了环境变量。如果我们以绝对路径的方式添加环境变量,当我们换了电脑或者环境,环境变量就失效了。我们这样通过程序找出相对路径来添加到环境变量,只要将当前整个工程一块拷贝到别的机器,就一定可以找到这个环境变量。

图书推荐

🔥强化学习:原理与Python实战

强化学习利用奖励信号训练智能体。有些任务并没有自带能给出奖励信号的环境,也没有现成的生成奖励信号的方法。为此,可以搭建奖励模型来提供奖励信号。在搭建奖励模型时,可以用数据驱动的机器学习方法来训练奖励模型,并且由人类提供数据。我们把这样的利用人类提供的反馈数据来训练奖励模型以用于强化学习的系统称为人类反馈强化学习,示意图如下。

想要学好这些知识,一定要有好的工具书,下面推荐一本理论与实践结合的好书。

书名:《强化学习:原理与Python实战》

作者:肖智清

出版社:机械工业出版社

购买链接:点击购买


目录
打赏
0
0
0
0
13
分享
相关文章
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
129 3
线性回归模型的原理、实现及应用,特别是在 Python 中的实践
本文深入探讨了线性回归模型的原理、实现及应用,特别是在 Python 中的实践。线性回归假设因变量与自变量间存在线性关系,通过建立线性方程预测未知数据。文章介绍了模型的基本原理、实现步骤、Python 常用库(如 Scikit-learn 和 Statsmodels)、参数解释、优缺点及扩展应用,强调了其在数据分析中的重要性和局限性。
109 3
|
5天前
|
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
37 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
2月前
|
Python Internet 模块
Python Internet 模块。
128 74
高精度保形滤波器Savitzky-Golay的数学原理、Python实现与工程应用
Savitzky-Golay滤波器是一种基于局部多项式回归的数字滤波器,广泛应用于信号处理领域。它通过线性最小二乘法拟合低阶多项式到滑动窗口中的数据点,在降噪的同时保持信号的关键特征,如峰值和谷值。本文介绍了该滤波器的原理、实现及应用,展示了其在Python中的具体实现,并分析了不同参数对滤波效果的影响。适合需要保持信号特征的应用场景。
116 11
高精度保形滤波器Savitzky-Golay的数学原理、Python实现与工程应用
Python进阶:深入理解import机制与importlib的妙用
本文深入解析了Python的`import`机制及其背后的原理,涵盖基本用法、模块缓存、导入搜索路径和导入钩子等内容。通过理解这些机制,开发者可以优化模块加载速度并确保代码的一致性。文章还介绍了`importlib`的强大功能,如动态模块导入、实现插件系统及重新加载模块,展示了如何利用这些特性编写更加灵活和高效的代码。掌握这些知识有助于提升编程技能,充分利用Python的强大功能。
21 4
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
132 63
【01】优雅草央央逆向技术篇之逆向接口协议篇-如何用python逆向接口协议?python逆向接口协议的原理和步骤-优雅草央千澈
【01】优雅草央央逆向技术篇之逆向接口协议篇-如何用python逆向接口协议?python逆向接口协议的原理和步骤-优雅草央千澈
|
25天前
|
[oeasy]python057_如何删除print函数_dunder_builtins_系统内建模块
本文介绍了如何删除Python中的`print`函数,并探讨了系统内建模块`__builtins__`的作用。主要内容包括: 1. **回忆上次内容**:上次提到使用下划线避免命名冲突。 2. **双下划线变量**:解释了双下划线(如`__name__`、`__doc__`、`__builtins__`)是系统定义的标识符,具有特殊含义。
29 3
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等