[oeasy]python0022_ python虚拟机_反编译_cpu架构_二进制字节码_汇编语言

简介: [oeasy]python0022_ python虚拟机_反编译_cpu架构_二进制字节码_汇编语言

 

程序本质

回忆上次内容

    • python3 的程序是一个 5.3M 的可执行文件
      • 我们通过which命令找到这个python3.8的位置
      • 将这个python3.8复制到我们的用户目录下
      • 这个文件还是能够执行的
        • 将这个文件转化为字节形态
          • 确实可以转化
          • 但是这个文件我们看不懂啊!!!😭

          image.gif编辑

            • 怎么才能看懂这些东西呢?🤔
              • 这个东西我们确实看不懂
                • 但是有人能看懂
                  • 谁呢?

                  真实的cpu

                    • 无论手机还是计算机
                      • 最核心器件的器件就是cpu

                      image.gif编辑

                        • 这个东西是个实实在在存在的实体
                        • 这个cpu就能看懂这些字节码吗?

                        cpu

                          • cpu能看懂这些字节码!!!
                          • 这些字节码
                            • 我们看不懂的
                            • cpu能看懂
                            • 这是属于cpu的机器语言
                            • 这就是cpu的一条条的机器指令(instruction)

                            image.gif编辑

                              • 机器指令码都是二进制字节形式的
                                • 我们尝试把python3.8转化为字节表现形式

                                反汇编-汇编语言助记符

                                #先把~/python3对应的机器语言输出为汇编指令形式(反汇编)

                                objdump -d python3.8 > python3.8.asm

                                vi python3.8.asm

                                  • 这次真的可以看懂了
                                    • 减法(sub)
                                    • 移动(mov)
                                    • 这些指令

                                    image.gif编辑

                                      • 可以发现当前系统的架构(指令集)是x86-64
                                      • 这些和我们刚才的字节形态有关系吗?

                                      对比

                                        • 用vi分窗口分别打开打开python3 和 python3.asm

                                        vi -o python3.8hex python3.8.asm

                                          • 下图中上半部分是机器语言

                                          image.gif编辑

                                            • 上图下半部分是机器语言对应的汇编指令助记符
                                            • ctrl+j、ctrl+k可以上下窗口切换
                                            • 我们来试着找找
                                              • python3.8文件中
                                              • 机器语言的0101和cpu的汇编指令的对应关系🧐

                                              找到了

                                                • 下面窗格
                                                  • 先跳到第8行
                                                  • endbr64 意味着 64位结束分支
                                                  • 下面就是第9行

                                                  image.gif编辑

                                                    • 第9行
                                                      • /48 83 找到上下的对应关系
                                                      • 也就是第一条执行的汇编指令sub
                                                      • sub对应substract 是减法
                                                      • 汇编指令是计算机 cpu 机器指令的助记符

                                                      查找对应关系

                                                        • 423000 就是初始化(init)的 cpu 开始执行指令的地址
                                                        • 我们在上面查找48 83
                                                          • 看有没有对应的字节
                                                          • /4883 ec08 488b...
                                                          • 在上面的窗格中
                                                          • 搜索这些字节形态

                                                          image.gif编辑

                                                            • 好像找到了对应关系
                                                              • 具体怎么对应的呢?
                                                                • 这台计算机用的是什么指令集呢?
                                                                • 什么是指令集来着?

                                                                指令集

                                                                  • 指令集就是指令的集合

                                                                  image.gif编辑

                                                                    • 指令集也叫计算机的架构
                                                                    • 不同架构的 cpu 有不同的指令集
                                                                      • 我们目前的这个浏览器里面的系统用的是 x86-64
                                                                      • 除此之外 armMIPSRISC-V 也是常用的指令集
                                                                        • 指令助记符和机器语言到底是则怎么对应的呢?

                                                                        回到代码

                                                                          • 代码会有不同的 section 模块
                                                                            • 入口是 init
                                                                            • 作用是初始化initialization

                                                                            image.gif编辑

                                                                              • 模块里面是具体的指令
                                                                                • 比如第一句 48 83 ec 08
                                                                                  • 为什么48 83 就可以代表减法
                                                                                  • 这是谁规定的呢?

                                                                                  查看指令集

                                                                                    • 这是cpu架构规定的
                                                                                      • 首先要明确到当前机器的cpu的架构
                                                                                      • 反汇编里面说是x86-64

                                                                                      image.gif编辑

                                                                                        • 到shell里面验证一下

                                                                                        image.gif编辑

                                                                                          • 当前机器所用的架构指令集确实是x86-64
                                                                                          • 这是谁的架构呢?

                                                                                          搜索

                                                                                            • 不会了就去搜索😄

                                                                                            image.gif编辑

                                                                                              • 去intel官网找指令集

                                                                                              查询x86_64指令集

                                                                                                • 找到cpu的手册
                                                                                                    • 可以找到指令和二进制状态之间的关系么?
                                                                                                      • 先要找到x86-64指令集中 48 83 这条指令

                                                                                                      image.gif编辑

                                                                                                        • 注意上图中
                                                                                                          • 100B中的B是0或1
                                                                                                          • 100B可以是1000
                                                                                                          • 也可以是1001
                                                                                                            • 这确实是一条减法指令
                                                                                                              • 而且是8位立即数和寄存器的减法运算

                                                                                                              逐步搜索

                                                                                                              image.gif编辑

                                                                                                                • 找起来真的很费劲
                                                                                                                  • 48 83 ec 08 对应 sub $0x8,%rsp
                                                                                                                  • 确实是一条减法指令
                                                                                                                  • 确实是8位立即数和寄存器的减法运算

                                                                                                                  image.gif编辑

                                                                                                                    • 和objdump的结果是一致的
                                                                                                                      • 废话!!!😠
                                                                                                                        • 除了减法指令sub之外
                                                                                                                        • 还有什么别的指令呢?

                                                                                                                        更多cpu指令

                                                                                                                          • 指令那可还有很多的
                                                                                                                            • 有运算的
                                                                                                                            • 有移位的
                                                                                                                            • 加减乘除都有

                                                                                                                            image.gif编辑

                                                                                                                              • 这些指令的集合就是指令集
                                                                                                                                • 指令集就是cpu运行的基础!
                                                                                                                                  • 这些机器语言的指令不能在别的指令集架构上运行么?

                                                                                                                                  移植 port

                                                                                                                                    • 想在别的指令集架构上运行程序
                                                                                                                                      • 就需要移植(port)
                                                                                                                                      • 移植(port)指的是从一种指令集移植到另一种指令集
                                                                                                                                        • 从这个词的词源
                                                                                                                                          • 可以看出欧美的航海文化基础
                                                                                                                                            • port 港口
                                                                                                                                              • 也可以看出我们的农耕文化基础
                                                                                                                                                • 移植

                                                                                                                                                image.gif编辑

                                                                                                                                                  • 不移植会如何呢?

                                                                                                                                                  不移植

                                                                                                                                                    • 这是playstation2的架构图
                                                                                                                                                      • cpu是mips架构的

                                                                                                                                                      image.gif编辑

                                                                                                                                                        • 不移植的话
                                                                                                                                                          • 就是让x86架构的pc
                                                                                                                                                          • 去直接执行这些基于mips架构的的0101... 字节码
                                                                                                                                                            • 就像让一个意大利泥瓦匠看一份中文写成的烹饪书来砌墙
                                                                                                                                                              • 鸡同鸭讲
                                                                                                                                                              • 驴唇不对马嘴
                                                                                                                                                              • 0101的文件执行出来全是乱的
                                                                                                                                                              • 完全不能用
                                                                                                                                                                • 而且不全是软件的问题
                                                                                                                                                                  • 也涉及到硬件等方面
                                                                                                                                                                  • 可能某个寄存器在新架构中根本就不存在

                                                                                                                                                                  架构师

                                                                                                                                                                    • 这个时候架构师要解决相当多的问题
                                                                                                                                                                      • 很不容易的

                                                                                                                                                                      image.gif编辑

                                                                                                                                                                        • 落实到我们的python3.8游乐场
                                                                                                                                                                          • 我们的python3.8就是这样的一系列的cpu指令
                                                                                                                                                                          • 可以解释py文件的
                                                                                                                                                                            • python3.8 又是如何解释py文件的来着?

                                                                                                                                                                            python3 执行过程

                                                                                                                                                                              • 不管是python3.8这个游乐场
                                                                                                                                                                                • 还是hello.py这个python程序
                                                                                                                                                                                • 都在我们的硬盘上

                                                                                                                                                                                image.gif编辑

                                                                                                                                                                                  • 先得把文件从硬盘读到内存

                                                                                                                                                                                  python3 执行的过程大致是这样

                                                                                                                                                                                    • 先把python3.8这个主解释器加载到内存中
                                                                                                                                                                                      • 然后在x86-64的cpu上执行
                                                                                                                                                                                      • 模拟出一台python虚拟机

                                                                                                                                                                                      image.gif编辑

                                                                                                                                                                                        • 对py文件解释执行
                                                                                                                                                                                        • 那为什么py程序可以跨架构跨平台呢?

                                                                                                                                                                                        架构的层次

                                                                                                                                                                                          • 不同架构的 cpu 都可以运行 python
                                                                                                                                                                                            • risc-v
                                                                                                                                                                                            • arm
                                                                                                                                                                                            • x64
                                                                                                                                                                                            • mips
                                                                                                                                                                                            • 龙芯

                                                                                                                                                                                            image.gif编辑

                                                                                                                                                                                              • 不同系统的环境都可以运行 python
                                                                                                                                                                                                • win
                                                                                                                                                                                                • mac
                                                                                                                                                                                                • linux
                                                                                                                                                                                                • freebsd

                                                                                                                                                                                                跨架构跨平台原理

                                                                                                                                                                                                  • 由于python3.8 的源文件
                                                                                                                                                                                                    • 被不同的架构的编译器 编译后
                                                                                                                                                                                                    • 被部署到 不同的cpu架构和系统上
                                                                                                                                                                                                    • 所以同样的py文件被加载之后
                                                                                                                                                                                                    • python程序可以对py文件跨架构、跨系统进行解释执行
                                                                                                                                                                                                    • 一次编写到处运行

                                                                                                                                                                                                    image.gif编辑

                                                                                                                                                                                                      • 不同的架构下
                                                                                                                                                                                                        • 汇编指令都不一样
                                                                                                                                                                                                        • 怎么能正确解释执行同样的python程序呢?

                                                                                                                                                                                                        跨架构跨平台原理

                                                                                                                                                                                                          • /usr/bin/python3.8 本身是二进制文件
                                                                                                                                                                                                            • 是基于当前操作系统当前架构编译出来的
                                                                                                                                                                                                              • 可执行二进制文件
                                                                                                                                                                                                                • 不同的架构有不同的编译器
                                                                                                                                                                                                                • 不同的编译器编译出来的python3.8
                                                                                                                                                                                                                • 是不同的二进制指令序列

                                                                                                                                                                                                                image.gif编辑

                                                                                                                                                                                                                  • python3.8 构建了一个运行时环境
                                                                                                                                                                                                                    • 这个环境可以解释读到的python语句
                                                                                                                                                                                                                    • python语句翻译成系统能读懂输入输出
                                                                                                                                                                                                                    • 翻译成当前架构能够执行的代码
                                                                                                                                                                                                                      • 然后边解释边执行
                                                                                                                                                                                                                      • 恭喜您完成了非常烧脑一个实验!
                                                                                                                                                                                                                      • 我们去总结吧!!!

                                                                                                                                                                                                                      总结

                                                                                                                                                                                                                        • python3 的程序是一个 5.3M 的可执行文件
                                                                                                                                                                                                                          • python3 里面全都是 cpu 指令
                                                                                                                                                                                                                          • 可以执行的那种
                                                                                                                                                                                                                          • 我们可以把指令对应的汇编找到
                                                                                                                                                                                                                            • objdump -d ~/python3 > python3.asm
                                                                                                                                                                                                                              • 汇编语句是和当前机器架构的指令集相关的
                                                                                                                                                                                                                                • uname -a可以查询指令集
                                                                                                                                                                                                                                  • 我们执行的过程其实就
                                                                                                                                                                                                                                    • 系统执行python3这个可执行文件
                                                                                                                                                                                                                                    • 给了python3一个参数hello.py
                                                                                                                                                                                                                                    • python3对于hello.py一句句的解释执行
                                                                                                                                                                                                                                    • 在显示器输出了hello world
                                                                                                                                                                                                                                    • python3执行完毕
                                                                                                                                                                                                                                    • 把控制权交回给 shell
                                                                                                                                                                                                                                      • 这就是我们执行hello.py的过程
                                                                                                                                                                                                                                      • 我想输出个稍微复杂点的东西
                                                                                                                                                                                                                                        • 可以做下面这个框架标题吗?🤔

                                                                                                                                                                                                                                        image.gif编辑

                                                                                                                                                                                                                                          相关文章
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          4月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          监控 Python
                                                                                                                                                                                                                                          【python】实现cpu/内存监控的功能(非常简单)
                                                                                                                                                                                                                                          【python】实现cpu/内存监控的功能(非常简单)
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          1月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          Java 数据安全/隐私保护
                                                                                                                                                                                                                                          一种优秀的虚拟机内存架构 - AQ
                                                                                                                                                                                                                                          【8月更文挑战第8天】AQ虚拟机内存架构是一种创新设计,旨在提供高效、可靠及灵活的内存管理。它通过精细划分内存并采用智能分配策略,动态调整以适应应用需求。对于高内存消耗任务,AQ预留足够连续空间避免碎片化;引入内存压缩技术以增加可用空间;具备精准垃圾回收机制提高内存利用率;同时加强安全性与稳定性防止因内存错误导致的问题。总之,AQ通过先进技术提升了虚拟机性能与稳定性。
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          并行计算 监控 数据处理
                                                                                                                                                                                                                                          构建高效Python应用:并发与异步编程的实战秘籍,IO与CPU密集型任务一网打尽!
                                                                                                                                                                                                                                          【7月更文挑战第16天】Python并发异步提升性能:使用`asyncio`处理IO密集型任务,如网络请求,借助事件循环实现非阻塞;`multiprocessing`模块用于CPU密集型任务,绕过GIL进行并行计算。通过任务类型识别、任务分割、避免共享状态、利用现代库和性能调优,实现高效编程。示例代码展示异步HTTP请求和多进程数据处理。
                                                                                                                                                                                                                                          43 8
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          并行计算 数据处理 Python
                                                                                                                                                                                                                                          Python并发编程迷雾:IO密集型为何偏爱异步?CPU密集型又该如何应对?
                                                                                                                                                                                                                                          【7月更文挑战第17天】Python并发编程中,异步编程(如`asyncio`)在IO密集型任务中提高效率,利用等待时间执行其他任务。但对CPU密集型任务,由于GIL限制,多线程效率不高,此时应选用`multiprocessing`进行多进程并行计算以突破限制。选择合适的并发策略是关键:异步适合IO,多进程适合CPU。理解这些能帮助构建高效并发程序。
                                                                                                                                                                                                                                          48 6
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          开发框架 并行计算 .NET
                                                                                                                                                                                                                                          从菜鸟到大神:Python并发编程深度剖析,IO与CPU的异步战争!
                                                                                                                                                                                                                                          【7月更文挑战第18天】Python并发涉及多线程、多进程和异步IO(asyncio)。异步IO适合IO密集型任务,如并发HTTP请求,能避免等待提高效率。多进程在CPU密集型任务中更优,因可绕过GIL限制实现并行计算。通过正确选择并发策略,开发者能提升应用性能和响应速度。
                                                                                                                                                                                                                                          70 3
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          算法 Java 程序员
                                                                                                                                                                                                                                          解锁Python高效之道:并发与异步在IO与CPU密集型任务中的精准打击策略!
                                                                                                                                                                                                                                          【7月更文挑战第17天】在数据驱动时代,Python凭借其优雅语法和强大库支持成为并发处理大规模数据的首选。并发与异步编程是关键,包括多线程、多进程和异步IO。对于IO密集型任务,如网络请求,可使用`concurrent.futures`和`asyncio`;CPU密集型任务则推荐多进程,如`multiprocessing`;`asyncio`适用于混合任务,实现等待IO时执行CPU任务。通过这些工具,开发者能有效优化资源,提升系统性能。
                                                                                                                                                                                                                                          67 4
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          并行计算 Java 大数据
                                                                                                                                                                                                                                          深度探索:Python异步编程如何优雅征服IO密集型任务,让CPU密集型任务也臣服!
                                                                                                                                                                                                                                          【7月更文挑战第17天】Python的异步编程借助`asyncio`库提升IO密集型任务效率,如并发下载网页,通过`async def`定义协程,`asyncio.gather`并发执行。在CPU密集型任务中,结合`ThreadPoolExecutor`实现并行计算,利用多核优势。`asyncio.run`简化事件循环管理,使Python在高负载场景下表现更佳。
                                                                                                                                                                                                                                          43 4
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          分布式计算 并行计算 Java
                                                                                                                                                                                                                                          Python并发风暴来袭!IO密集型与CPU密集型任务并发策略大比拼,你站哪队?
                                                                                                                                                                                                                                          【7月更文挑战第17天】Python并发处理IO密集型(如网络请求)与CPU密集型(如数学计算)任务。IO密集型适合多线程和异步IO,如`ThreadPoolExecutor`进行网页下载;CPU密集型推荐多进程,如`multiprocessing`模块进行并行计算。选择取决于任务类型,理解任务特性是关键,以实现最佳效率。
                                                                                                                                                                                                                                          41 4
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          开发框架 并行计算 .NET
                                                                                                                                                                                                                                          脑洞大开!Python并发与异步编程的哲学思考:IO密集型与CPU密集型任务的智慧选择!
                                                                                                                                                                                                                                          【7月更文挑战第18天】在Python中,异步编程(如`asyncio`)适合处理IO密集型任务,通过非阻塞操作提高响应性,例如使用`aiohttp`进行异步HTTP请求。而对于CPU密集型任务,由于GIL的存在,多进程(`multiprocessing`)能实现并行计算,如使用进程池进行大量计算。明智选择并发模型是性能优化的关键,体现了对任务特性和编程哲学的深刻理解。
                                                                                                                                                                                                                                          28 2
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          2月前
                                                                                                                                                                                                                                          |
                                                                                                                                                                                                                                          UED 开发者 Python
                                                                                                                                                                                                                                          Python并发编程新纪元:异步编程如何重塑IO与CPU密集型任务的处理方式?
                                                                                                                                                                                                                                          【7月更文挑战第18天】Python异步编程提升IO任务效率,非阻塞模式减少等待时间,优化用户体验。asyncio库与await关键字助力编写非阻塞代码,示例展示异步HTTP请求。CPU密集型任务中,异步编程结合多进程可提升效率。异步编程挑战包括代码复杂性,解决策略包括使用类型提示、异步框架及最佳实践。异步编程重塑任务处理方式,成为现代Python开发的关键。
                                                                                                                                                                                                                                          27 2
                                                                                                                                                                                                                                          下一篇
                                                                                                                                                                                                                                          DDNS