[oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree

简介: [oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree

语义分析_抽象语法树_反汇编 回忆

  • 上次回顾了一下历史
  • python 是如何从无到有的
  • 看到 Guido 长期的坚持和努力


添加图片注释,不超过 140 字(可选)

  • python究竟是如何理解
  • print("hello")的?
  • 这些ascii字母如何被组织起来执行?


纯文本

  • 首先编写Guido的简历

print("1982------Guido in cwi") print("1995------Guido in cnri") print("2000------Guido in beopen") print("2005------Guido in google") print("2012------Guido in dropbox") print("2020------Guido in microsoft")

  • 并保存为Guido.py

生成token流

  • 回到shell之后
  • 从字符流生成token流


添加图片注释,不超过 140 字(可选)

  • 这个过程叫做分词

分词

  • 首先把一个个字符组成词
  • 分析一下哪些字可以组成词
  • 术语叫词法分析(lexical analysis)


添加图片注释,不超过 140 字(可选)

  • 词分析出来之后呢?

组词

  • 词分析出来就是怎么组词的问题
  • 哪些词和哪些词先组合
  • 哪些词和哪些词后组合


  • 生成一棵抽象语法树
  • AST(Abstract Syntax Tree)


添加图片注释,不超过 140 字(可选)

  • 我能看看这棵ast树么?

引入ast模块

添加图片注释,不超过 140 字(可选)

  • 具体怎么做呢?

流程

  • 先把这个ast模块导入(import)进来
  • 第一句就是import ast
  • 回车之后没有任何报错
  • 那就是执行成功了
  • 后面也一样
  • 没有报错就是执行成功了


添加图片注释,不超过 140 字(可选)

  • 然后读取guido.py并送到s
  • 然后对于s进行语法分析(parse)

添加图片注释,不超过 140 字(可选)

  • 再把分析(parse)的结果进行转储(dump)
  • 看起来有点乱
  • 可以清晰一些么?


升级Python

  • 目前lanqiao.cn上面的python是3.8
  • 这个清晰缩进的格式需要在3.9以上完成
  • 需要升级

sudo apt update sudo apt install python3.9

  • 升级之后就可以使用Python3.9了

添加图片注释,不超过 140 字(可选)

缩进换行

  • 只能在本地演示一下

添加图片注释,不超过 140 字(可选)

  • 这个就是把词组成语法树的样子
  • 如何理解这棵树呢?
  • 我们看一个例子

表达式运算

  • 如果给的表达式为 1 2 3

添加图片注释,不超过 140 字(可选)

  • 结合序为下图

添加图片注释,不超过 140 字(可选)

  • 前两个先结合
  • 得到的结果作为下一个运算的左操作数
  • 然后和第3个结合

结合序

  • 如果把 第一个* 改成 + 号
  • 其他什么也没加

添加图片注释,不超过 140 字(可选)

  • 表达式是1 + 2 * 3

添加图片注释,不超过 140 字(可选)

  • 后两个会先结合
  • 得到的结果 作为下一个运算的 右操作数
  • 然后再和1 进行 加法运算


  • 有了 语法树
  • 下一步 要做什么呢?


  • 这棵语法树 我们能看懂
  • 但是cpu 需要的是
  • 能执行的 一条条字节码指令



翻译成 字节码

  • 要把源程序 翻译成字节码 才能执行
  • 字节码 对应着cpu的指令


  • 怎么把ast 转化为字节码(指令) 呢?
  • 需要 编译(compile)


  • 从一种语言 到 另一种语言
  • 从py文件
  • 到字节码(指令)
  • 就是编译
  • compile



添加图片注释,不超过 140 字(可选)

compile

添加图片注释,不超过 140 字(可选)

  • 我可以看看这个编译过程么?

指令

  • instruction
  • python3 -m dis Guido.py
  • -m 代表使用模块
  • dis 代表反编译(disassemble)


添加图片注释,不超过 140 字(可选)

  • 我们可以看见
  • 前面是行号
  • 每行对应4条指令
  • LOAD_NAME 装载(函数)名字
  • LOAD_CONST 装载常量
  • CALL_FUNCTION 调用函数
  • POP_TOP 弹栈



编译结果

  • 先看看这个pyc文件
  • 注意他在__pycache__文件夹下


添加图片注释,不超过 140 字(可选)

  • :%!xxd
  • 把文件转化为字节形态


添加图片注释,不超过 140 字(可选)

  • 这纯纯的机器语言字节形态
  • 实在是看不懂啊😭
  • 这真的是指令么?


  • 究竟什么是指令呢?

指令

  • py文件每行print 对应4条指令
  • LOAD_NAME 装载(函数)名字
  • LOAD_CONST 装载常量
  • CALL_FUNCTION 调用函数
  • POP_TOP 弹栈


添加图片注释,不超过 140 字(可选)

  • 这样 我们 能否找到
  • 4条指令 分别对应的 字节状态值


找到对应关系

指令助记符

指令含义

十进制状态

十六进制状态

LOAD_NAME

装载函数名称

101

0x65

LOAD_CONST

装载参数

100

0x64

CALL_FUNCTION

调用函数

142

0x8e

POP_TOP

弹栈返回

1

0x01

  • 可以找对应关系

添加图片注释,不超过 140 字(可选)

  • 我们从头捋一下

python3 执行过程

  • 不管是python3这个游乐场
  • 还是Guido.py这个python程序
  • 都在我们的硬盘上


添加图片注释,不超过 140 字(可选)

  • 先得把文件从硬盘读到内存

python3 执行的过程大致是这样

  • 先把python3.8这个主解释器
  • 加载到内存中


  • 然后 在x86-64的cpu上 执行
  • 模拟出 一台python虚拟机


添加图片注释,不超过 140 字(可选)

  • 准备开始 对py文件 解释执行

先编译

  • 然后把参数 Guido.py 这个需要执行的程序 加载到内存
  • 词法分析 得到 词流(token stream)
  • 语法分析 得到 抽象语法树(Abstract Syntax Tree)
  • 编译 得到 字节码 (byte_code)


添加图片注释,不超过 140 字(可选)

  • 也就是编译后 的pyc文件

解释执行

  • 不过 这个pyc指令文件
  • 是基于python虚拟机的 虚拟cpu的 指令集的


添加图片注释,不超过 140 字(可选)

  • 需要放到 模拟好的 python虚拟机中
  • 一条条指令 进行执行

换句话说

  • 简化版的 hello.py 的执行过程是:
  • 给了 python3 一个参数 Guido.py
  • 使用 python3 这个解释器来解释执行 Guido.py
  • Guido.py中的语句一句句地依次解释执行


  • 全解释完成 后
  • 退出python这个程序
  • 把控制权交回到shell


添加图片注释,不超过 140 字(可选)

  • 这些 都是基于 解释器python3的
  • 所谓的 解释器python3
  • 先编译成 python虚拟机的 虚拟指令字节码
  • 然后用 python虚拟机 直接执行虚拟指令



  • 而解释器(python3) 是
  • 在不同系统 不同架构的cpu语言上 运行的


添加图片注释,不超过 140 字(可选)

  • 那不同的系统、cpu架构
  • python3 为什么 都能正确地解释?


总结

  • 这次把py源文件
  • 词法分析 得到 词流(token stream)
  • 语法分析 得到 抽象语法树(Abstract Syntax Tree)
  • 这里确立了优先级


  • 编译 得到 字节码 (bytecode)


  • 字节码我们看不懂
  • 所以反编译 得到 指令文件(opcode)
  • 指令文件是基于python虚拟机的虚拟cpu的指令集



添加图片注释,不超过 140 字(可选)

  • 先从 python3最基础的
  • 变量声明和赋值来看看
  • python虚拟机是如何做的?🤔




目录
相关文章
|
2月前
|
人工智能 Shell 开发工具
[oeasy]python062_在python中完成输入和输出_input_print
本文介绍了在Python中使用`input()`和`print()`函数完成输入和输出操作的基础知识。通过编写简单的程序,如问候用户和统计苹果数量,演示了如何添加提示信息、处理用户输入并输出结果。同时,回顾了上一次课程内容,包括`input`函数的参数和提示词的使用。文中还展示了如何在vim编辑器中编写和运行Python代码,并对vim和shell的基本操作进行了总结。最后提供了相关学习资源链接,方便读者进一步学习。
134 66
|
2天前
|
Shell Python
[oeasy]python072_名字空间是怎么玩的_from_import_as_导入_namespace
本文介绍了Python中名字空间和模块导入的使用方法。主要内容包括: 1. **回忆上次内容**:回顾了之前导入系统模块(如`__hello__`、`time`)和自定义模块(如`my_file`),并介绍了如何导入和使用模块中的变量。 2. **从shell开始**:展示了如何在命令行中编辑和切换文件,以及如何通过`import`语句引入模块。 3. **修改oeasy.py**:演示了如何通过`import my_file`导入模块,并将模块中的`pi`赋值给本地变量`pi`。 4. **locals()函数**:解释了如何使用`locals()`查看当前作用域内的本地变量及其值。
21 8
|
1月前
|
人工智能 Shell 开发工具
[oeasy]python065python报错怎么办_try_试着来_except_发现异常
本文介绍了Python中处理异常的基本方法,重点讲解了`try`和`except`的用法。通过一个计算苹果重量的小程序示例,展示了如何捕获用户输入错误并进行处理。主要内容包括: 1. **回顾上次内容**:简要回顾了Shell环境、Python3游乐场和Vim编辑器的使用。 2. **编写程序**:编写了一个简单的程序来计算苹果的总重量,但发现由于输入类型问题导致结果错误。 3. **调试与修正**:通过调试发现输入函数返回的是字符串类型,需要将其转换为整数类型才能正确计算。
55 32
|
12天前
|
人工智能 自然语言处理 Shell
[oeasy]python070_如何导入模块_导入模块的作用_hello_dunder_双下划线
本文介绍了如何在Python中导入模块及其作用,重点讲解了`__hello__`模块的导入与使用。通过`import`命令可以将外部模块引入当前环境,增强代码功能。例如,导入`__hello__`模块后可输出“Hello world!”。此外,还演示了如何使用`help()`和`dir()`函数查询模块信息,并展示了导入多个模块的方法。最后,通过一个实例,介绍了如何利用`jieba`、`WordCloud`和`matplotlib`模块生成词云图。总结来说,模块是封装好的功能部件,能够简化编程任务并提高效率。未来将探讨如何创建自定义模块。
32 8
|
9天前
|
缓存 Shell 开发工具
[oeasy]python071_我可以自己做一个模块吗_自定义模块_引入模块_import_diy
本文介绍了 Python 中模块的导入与自定义模块的创建。首先,我们回忆了模块的概念,即封装好功能的部件,并通过导入 `__hello__` 模块实现了输出 "hello world!" 的功能。接着,尝试创建并编辑自己的模块 `my_file.py`,引入 `time` 模块以获取当前时间,并在其中添加自定义输出。
21 4
|
27天前
|
数据库 Python
[oeasy]python066_如何捕获多个异常_try_否则_else_exception
本文介绍了Python中`try...except...else`结构的使用方法。主要内容包括: 1. **回顾上次内容**:简要复习了`try`和`except`的基本用法,强调了异常处理的重要性。 2. **详细解释**: - `try`块用于尝试执行代码,一旦发现错误会立即终止并跳转到`except`块。 - `except`块用于捕获特定类型的异常,并进行相应的处理。 - `else`块在没有异常时执行,是可选的。 3. **示例代码**:通过具体例子展示了如何捕获不同类型的异常(如`ValueError`和`ZeroDivisionError`),并解释了异常处理
53 24
|
3月前
|
Unix Linux 程序员
[oeasy]python053_学编程为什么从hello_world_开始
视频介绍了“Hello World”程序的由来及其在编程中的重要性。从贝尔实验室诞生的Unix系统和C语言说起,讲述了“Hello World”作为经典示例的起源和流传过程。文章还探讨了C语言对其他编程语言的影响,以及它在系统编程中的地位。最后总结了“Hello World”、print、小括号和双引号等编程概念的来源。
130 80
|
19天前
|
人工智能 数据库 开发者
[oeasy]python068_异常处理之后做些什么_try语句的完全体_最终_finally
介绍了 Python 中 `try` 语句的完全体,包括 `try`、`except`、`else` 和 `finally` 子句的使用。通过实例展示了如何捕获异常并输出详细的错误信息,如文件名和行号。特别强调了 `finally` 子句的作用,无论是否发生异常,`finally` 都会执行,常用于清理操作。最后总结了 `try` 语句的四个部分及其应用场景,并简要提及了 Python 社区的决策机制。 #try #except #else #finally
23 1
|
1月前
|
缓存 Shell 开发工具
[oeasy]python064_命令行工作流的总结_vim_shell_python
本文总结了命令行工作流中的关键工具和操作,包括vim、shell和Python。主要内容如下: 1. **上次回顾**:完成了输入输出的代码编写,并再次练习了vim的使用。 2. **shell基础**:介绍了shell环境及其基本命令,如`pwd`、`cd`、`ll -l`等。 3. **Python游乐场**:通过`python3`命令进入Python交互环境,可以进行简单计算和函数调用,常用函数有`help`、`ord`、`chr`等。 4. **vim编辑器**:详细讲解了vim的三种模式(正常模式、插入模式、底行命令模式)及其切换方法,以及常用的底行命令如`:w`、`:q`、`
87 15
|
3月前
|
人工智能 C语言 Python
[oeasy]python051_什么样的变量名能用_标识符_identifier
本文介绍了Python中变量名的命名规则,强调标识符(identifier)必须以字母或下划线开始,后续可包含字母、下划线及数字。通过`isidentifier()`函数可验证字符串是否为合法标识符。文中还探讨了为何数字不能作为标识符的开头,并提供了相关练习与解答,最后提及这些规则源自C语言的影响。
144 69

热门文章

最新文章