[oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree

简介: [oeasy]python0135_python_语义分析_ast_抽象语法树_abstract_syntax_tree

语义分析_抽象语法树_反汇编 回忆

  • 上次回顾了一下历史
  • python 是如何从无到有的
  • 看到 Guido 长期的坚持和努力


添加图片注释,不超过 140 字(可选)

  • python究竟是如何理解
  • print("hello")的?
  • 这些ascii字母如何被组织起来执行?


纯文本

  • 首先编写Guido的简历

print("1982------Guido in cwi") print("1995------Guido in cnri") print("2000------Guido in beopen") print("2005------Guido in google") print("2012------Guido in dropbox") print("2020------Guido in microsoft")

  • 并保存为Guido.py

生成token流

  • 回到shell之后
  • 从字符流生成token流


添加图片注释,不超过 140 字(可选)

  • 这个过程叫做分词

分词

  • 首先把一个个字符组成词
  • 分析一下哪些字可以组成词
  • 术语叫词法分析(lexical analysis)


添加图片注释,不超过 140 字(可选)

  • 词分析出来之后呢?

组词

  • 词分析出来就是怎么组词的问题
  • 哪些词和哪些词先组合
  • 哪些词和哪些词后组合


  • 生成一棵抽象语法树
  • AST(Abstract Syntax Tree)


添加图片注释,不超过 140 字(可选)

  • 我能看看这棵ast树么?

引入ast模块

添加图片注释,不超过 140 字(可选)

  • 具体怎么做呢?

流程

  • 先把这个ast模块导入(import)进来
  • 第一句就是import ast
  • 回车之后没有任何报错
  • 那就是执行成功了
  • 后面也一样
  • 没有报错就是执行成功了


添加图片注释,不超过 140 字(可选)

  • 然后读取guido.py并送到s
  • 然后对于s进行语法分析(parse)

添加图片注释,不超过 140 字(可选)

  • 再把分析(parse)的结果进行转储(dump)
  • 看起来有点乱
  • 可以清晰一些么?


升级Python

  • 目前lanqiao.cn上面的python是3.8
  • 这个清晰缩进的格式需要在3.9以上完成
  • 需要升级

sudo apt update sudo apt install python3.9

  • 升级之后就可以使用Python3.9了

添加图片注释,不超过 140 字(可选)

缩进换行

  • 只能在本地演示一下

添加图片注释,不超过 140 字(可选)

  • 这个就是把词组成语法树的样子
  • 如何理解这棵树呢?
  • 我们看一个例子

表达式运算

  • 如果给的表达式为 1 2 3

添加图片注释,不超过 140 字(可选)

  • 结合序为下图

添加图片注释,不超过 140 字(可选)

  • 前两个先结合
  • 得到的结果作为下一个运算的左操作数
  • 然后和第3个结合

结合序

  • 如果把 第一个* 改成 + 号
  • 其他什么也没加

添加图片注释,不超过 140 字(可选)

  • 表达式是1 + 2 * 3

添加图片注释,不超过 140 字(可选)

  • 后两个会先结合
  • 得到的结果 作为下一个运算的 右操作数
  • 然后再和1 进行 加法运算


  • 有了 语法树
  • 下一步 要做什么呢?


  • 这棵语法树 我们能看懂
  • 但是cpu 需要的是
  • 能执行的 一条条字节码指令



翻译成 字节码

  • 要把源程序 翻译成字节码 才能执行
  • 字节码 对应着cpu的指令


  • 怎么把ast 转化为字节码(指令) 呢?
  • 需要 编译(compile)


  • 从一种语言 到 另一种语言
  • 从py文件
  • 到字节码(指令)
  • 就是编译
  • compile



添加图片注释,不超过 140 字(可选)

compile

添加图片注释,不超过 140 字(可选)

  • 我可以看看这个编译过程么?

指令

  • instruction
  • python3 -m dis Guido.py
  • -m 代表使用模块
  • dis 代表反编译(disassemble)


添加图片注释,不超过 140 字(可选)

  • 我们可以看见
  • 前面是行号
  • 每行对应4条指令
  • LOAD_NAME 装载(函数)名字
  • LOAD_CONST 装载常量
  • CALL_FUNCTION 调用函数
  • POP_TOP 弹栈



编译结果

  • 先看看这个pyc文件
  • 注意他在__pycache__文件夹下


添加图片注释,不超过 140 字(可选)

  • :%!xxd
  • 把文件转化为字节形态


添加图片注释,不超过 140 字(可选)

  • 这纯纯的机器语言字节形态
  • 实在是看不懂啊😭
  • 这真的是指令么?


  • 究竟什么是指令呢?

指令

  • py文件每行print 对应4条指令
  • LOAD_NAME 装载(函数)名字
  • LOAD_CONST 装载常量
  • CALL_FUNCTION 调用函数
  • POP_TOP 弹栈


添加图片注释,不超过 140 字(可选)

  • 这样 我们 能否找到
  • 4条指令 分别对应的 字节状态值


找到对应关系

指令助记符

指令含义

十进制状态

十六进制状态

LOAD_NAME

装载函数名称

101

0x65

LOAD_CONST

装载参数

100

0x64

CALL_FUNCTION

调用函数

142

0x8e

POP_TOP

弹栈返回

1

0x01

  • 可以找对应关系

添加图片注释,不超过 140 字(可选)

  • 我们从头捋一下

python3 执行过程

  • 不管是python3这个游乐场
  • 还是Guido.py这个python程序
  • 都在我们的硬盘上


添加图片注释,不超过 140 字(可选)

  • 先得把文件从硬盘读到内存

python3 执行的过程大致是这样

  • 先把python3.8这个主解释器
  • 加载到内存中


  • 然后 在x86-64的cpu上 执行
  • 模拟出 一台python虚拟机


添加图片注释,不超过 140 字(可选)

  • 准备开始 对py文件 解释执行

先编译

  • 然后把参数 Guido.py 这个需要执行的程序 加载到内存
  • 词法分析 得到 词流(token stream)
  • 语法分析 得到 抽象语法树(Abstract Syntax Tree)
  • 编译 得到 字节码 (byte_code)


添加图片注释,不超过 140 字(可选)

  • 也就是编译后 的pyc文件

解释执行

  • 不过 这个pyc指令文件
  • 是基于python虚拟机的 虚拟cpu的 指令集的


添加图片注释,不超过 140 字(可选)

  • 需要放到 模拟好的 python虚拟机中
  • 一条条指令 进行执行

换句话说

  • 简化版的 hello.py 的执行过程是:
  • 给了 python3 一个参数 Guido.py
  • 使用 python3 这个解释器来解释执行 Guido.py
  • Guido.py中的语句一句句地依次解释执行


  • 全解释完成 后
  • 退出python这个程序
  • 把控制权交回到shell


添加图片注释,不超过 140 字(可选)

  • 这些 都是基于 解释器python3的
  • 所谓的 解释器python3
  • 先编译成 python虚拟机的 虚拟指令字节码
  • 然后用 python虚拟机 直接执行虚拟指令



  • 而解释器(python3) 是
  • 在不同系统 不同架构的cpu语言上 运行的


添加图片注释,不超过 140 字(可选)

  • 那不同的系统、cpu架构
  • python3 为什么 都能正确地解释?


总结

  • 这次把py源文件
  • 词法分析 得到 词流(token stream)
  • 语法分析 得到 抽象语法树(Abstract Syntax Tree)
  • 这里确立了优先级


  • 编译 得到 字节码 (bytecode)


  • 字节码我们看不懂
  • 所以反编译 得到 指令文件(opcode)
  • 指令文件是基于python虚拟机的虚拟cpu的指令集



添加图片注释,不超过 140 字(可选)

  • 先从 python3最基础的
  • 变量声明和赋值来看看
  • python虚拟机是如何做的?🤔




目录
打赏
0
0
0
0
9
分享
相关文章
[oeasy]python082_变量部分总结_variable_summary
本文介绍了变量的定义、声明、赋值及删除操作,以及Python中的命名规则和常见数据类型。通过示例讲解了字符串与整型的基本用法、类型转换方法和加法运算的区别。此外,还涉及异常处理(try-except)、模块导入(如math和random)及随机数生成等内容。最后总结了实验要点,包括捕获异常、进制转化、变量类型及其相互转换,并简述了编程中AI辅助的应用策略,强调明确目标、分步实施和逐步巩固的重要性。更多资源可在蓝桥、GitHub和Gitee获取。
195 97
[oeasy]python089_列表_删除列表项_remove_列表长度_len
本文介绍了Python列表(list)的操作方法,重点讲解了`remove`方法的使用。通过实例演示如何删除列表中的元素,探讨了`ValueError`异常产生的原因,并分析了时间复杂度O(n)的概念。同时提及了`clear`方法清空列表的功能及`len`函数获取列表长度的用法。最后以购物清单为例,展示列表的实际应用场景,并预告快速生成列表的方法将在后续内容中介绍。
151 62
[oeasy]python093_find方法_指数为负数_index_实际效果
本文介绍了Python中`find`方法与索引(index)的使用,包括负数索引的实际效果。回顾了`eval`函数的应用,并强调类名如`str`、`int`、`list`不可用作变量名以避免覆盖。通过示例解析了负数索引在字符串和列表中的作用,以及`index`方法的三个参数(value、start、stop)的用法。同时对比了`index`和`find`方法的区别:`index`找不到子串时抛出`ValueError`,而`find`返回-1。最后总结了正负索引的使用场景及两者的特性,提供了相关学习资源链接。
308 8
[oeasy]python091_列表_索引_index_中括号_索引函数
本文介绍了Python中列表与字符串的索引及index函数用法。通过range生成列表,使用索引[]访问和修改列表元素,index函数查找元素位置。字符串支持索引访问但不可直接修改。还探讨了16进制数在Python中的表示方法,以及日期、月份等特殊字符的Unicode范围。最后总结了列表与字符串操作的区别,并预告后续内容,提供蓝桥云课、GitHub和Gitee链接供进一步学习。
84 20
|
3月前
|
[oeasy]python090_列表_构造_范围_range_start_end_step_步长
本文介绍了Python中列表的生成方法,重点讲解了`range()`函数的使用。通过`range(start, stop, step)`可生成一系列整数,支持正负步长,但不支持小数参数。文章从基础的列表追加、直接赋值到复杂的应用场景(如生成等宽字体的月份列表),结合实例演示了`range()`的灵活性与实用性。最后总结了`range()`的关键特性:前闭后开、支持负数步长,并提供了进一步学习的资源链接。
121 15
|
3月前
|
[oeasy]python086方法_method_函数_function_区别
本文详细解析了Python中方法(method)与函数(function)的区别。通过回顾列表操作如`append`,以及随机模块的使用,介绍了方法作为类的成员需要通过实例调用的特点。对比内建函数如`print`和`input`,它们无需对象即可直接调用。总结指出方法需基于对象调用且包含`self`参数,而函数独立存在无需`self`。最后提供了学习资源链接,方便进一步探索。
87 17
[oeasy]python081_ai编程最佳实践_ai辅助编程_提出要求_解决问题
本文介绍了如何利用AI辅助编程解决实际问题,以猫屎咖啡的购买为例,逐步实现将购买斤数换算成人民币金额的功能。文章强调了与AI协作时的三个要点:1) 去除无关信息,聚焦目标;2) 将复杂任务拆解为小步骤,逐步完成;3) 巩固已有成果后再推进。最终代码实现了输入验证、单位转换和价格计算,并保留两位小数。总结指出,在AI时代,人类负责明确目标、拆分任务和确认结果,AI则负责生成代码、解释含义和提供优化建议,编程不会被取代,而是会更广泛地融入各领域。
136 28
|
3月前
|
[oeasy]python092_eval_衡量_转化为列表
本文探讨了 Python 中 `eval` 函数的用法及其与字符串和列表之间的转换关系。通过实例分析,展示了如何使用 `eval` 将字符串转化为对应的数据类型,例如将表示列表的字符串转回列表。同时,文章深入讲解了 `eval` 的工作机制,包括根据本地和全局变量对字符串进行计算的能力。此外,还提醒了命名变量时需避免覆盖内置类名(如 `str`、`int`、`list`)的重要性,以免影响程序正常运行。最后,简要提及字符串和列表索引中负数的应用,并为读者提供了进一步学习的资源链接。
75 2
[oeasy]python088_列表_清空列表_clear
本文介绍了Python中列表的清空方法`clear`。通过实例讲解了`clear`与将列表赋值为空列表的区别,前者会清空原列表内容,而后者创建新空列表,不影响原列表。文中以收银程序为例,展示了`clear`的实际应用场景,并通过地址观察解释了两者的机制差异。最后总结了相关术语如`list`、`append`、`clear`等,帮助理解列表操作及方法调用的概念。
76 6
[oeasy]python083_类_对象_成员方法_method_函数_function_isinstance
本文介绍了Python中类、对象、成员方法及函数的概念。通过超市商品分类的例子,形象地解释了“类型”的概念,如整型(int)和字符串(str)是两种不同的数据类型。整型对象支持数字求和,字符串对象支持拼接。使用`isinstance`函数可以判断对象是否属于特定类型,例如判断变量是否为整型。此外,还探讨了面向对象编程(OOP)与面向过程编程的区别,并简要介绍了`type`和`help`函数的用法。最后总结指出,不同类型的对象有不同的运算和方法,如字符串有`find`和`index`方法,而整型没有。更多内容可参考文末提供的蓝桥、GitHub和Gitee链接。
76 11

推荐镜像

更多
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问