PHP底层Zend引擎揭秘——从opcode到JIT的编译之旅

简介: PHP是一种解释型语言,但它的执行过程远比“逐行解释”复杂得多。Zend引擎将PHP源代码编译为中间表示(opcode),然后执行这些opcode。

PHP是一种解释型语言,但它的执行过程远比“逐行解释”复杂得多。Zend引擎将PHP源代码编译为中间表示(opcode),然后执行这些opcode。PHP 8引入的JIT(即时编译)又将部分opcode编译为机器码,大幅提升CPU密集型任务的性能。理解Zend引擎的工作方式,有助于编写对Zend友好的代码,也能更好地理解PHP的性能特征。
参考:https://xrzqr.cn/category/travel-advice.html

PHP的执行流程分为四个阶段:词法分析、语法分析、编译和执行。词法分析器(Lexer)将源代码转换为token流;语法分析器(Parser)根据语法规则将token流构建为抽象语法树(AST);编译器将AST转换为opcode数组;Zend虚拟机执行opcode。对于每个请求,这四步都会发生(除非使用OpCache缓存opcode)。

AST(抽象语法树)是PHP 7引入的重要中间表示。在PHP 5中,语法分析器直接生成opcode,导致了许多语法歧义和编译错误。AST将语法分析与opcode生成解耦,使语法分析更清晰,也为静态分析工具提供了更好的数据源。AST还支持更复杂的语法变换,如$a ?? $b ?? $c的降级。

Opcode是Zend虚拟机的指令,类似于CPU的机器码。每个opcode包含操作码(如ADD、ECHO、JMP)和操作数(如变量、常量、临时值)。PHP 8有约200个opcode。常见的opcode包括:ZEND_ADD(加法)、ZEND_ASSIGN(赋值)、ZEND_INIT_METHOD_CALL(初始化方法调用)、ZEND_DO_FCALL(执行函数调用)。

Zend虚拟机是一个基于栈的虚拟机。每个opcode执行时,从操作数栈中弹出值,执行操作,然后将结果压回栈中。虚拟机的核心是execute_ex函数,它是一个巨大的switch语句,根据opcode分发到对应的处理逻辑。与寄存器虚拟机相比,栈虚拟机实现简单,但需要更多的数据移动指令。
参考:https://xrzqr.cn/category/disaster-warning.html

变量存储:PHP变量在Zend引擎中表示为zval结构体。zval包含类型信息(IS_LONG、IS_DOUBLE、IS_STRING、IS_ARRAY、IS_OBJECT等)、实际值的联合体、以及引用计数。PHP 7重构了zval,将大部分类型直接存储在zval中(而不是通过指针),减少了内存分配和间接访问的开销。

引用计数是PHP内存管理的核心。每个zval有一个refcount字段,记录指向该zval的符号数量。当refcount降为0时,该zval被释放。对于数组和对象,其成员元素也各自有引用计数。引用计数解决了循环引用问题吗?不能——循环引用(如对象A引用对象B,B引用A)会导致refcount永远不会为0。PHP使用同步回收算法来处理循环引用,在根缓冲区中追踪可疑对象。

写时复制是PHP的优化策略。当多个变量指向同一个zval时,如果其中一个变量尝试修改该zval,Zend引擎会复制该zval,使修改不影响其他变量。写时复制避免了不必要的复制,同时保证了变量之间的隔离性。但写时复制也有开销——每次修改都需要检查refcount。
参考:https://xrzqr.cn/category/weather-science.html

函数的编译:每个PHP函数在编译时被分配一个独立的opcode数组。函数内的变量名被分配为编译期数字(称为“变量编号”),运行时查找变量时使用编号而不是名称字符串,提高了执行速度。函数调用时,Zend引擎创建一个新的执行数据(zend_execute_data),包含局部变量空间、参数值、以及返回地址。

类的编译:类定义在编译期被处理,生成类元数据(zend_class_entry)。类元数据包含属性表、方法表、常量表、以及继承信息。属性访问在编译期被解析为偏移量,运行时通过偏移量直接访问属性,避免了名称查找。方法调用通过方法表进行,支持虚函数(多态)。

OpCache是PHP加速的关键组件。OpCache将编译后的opcode缓存到共享内存中,跳过重复的编译过程。对于每个请求,OpCache直接加载缓存的opcode执行。OpCache还执行优化,如opcode折叠(1+2替换为3)、死代码消除、条件常量折叠等。OpCache是PHP 5.5+的内置扩展,在生产环境中必须开启。

PHP 8的JIT是Zend引擎的里程碑。JIT(Just-In-Time Compilation)在运行时将热点opcode编译为机器码,然后直接执行机器码。JIT主要优化CPU密集型任务(如循环、数学运算),对I/O密集型任务效果有限。

JIT在Zend引擎中有两种模式:函数级别JIT和跟踪级别JIT。函数级别JIT编译整个函数的opcode;跟踪级别JIT只编译执行频率高的代码路径(如循环体)。跟踪级别JIT优化更激进,但实现更复杂。JIT使用dynasm作为后端代码生成器,支持x86_64和AArch64架构。

JIT的性能提升因任务而异。在对称加密、图像处理、压缩解压等纯计算任务中,JIT可以带来3-10倍的性能提升。在Web框架应用中,提升较小(10-30%),因为瓶颈通常在I/O和数据库。JIT需要权衡——编译本身有成本,且生成的机器码占用内存。通过opcache.jit配置可以调节JIT的激进程度。

Zend引擎的调试:php -d opcache.opt_debug_level=0x10000 script.php可以查看优化后的opcode;phpdbg是Zend引擎的调试器,支持断点、单步执行、查看变量;vld扩展(Vulcan Logic Dumper)可以转储opcode的文本表示。

对Zend友好的编程实践:避免深度嵌套的函数调用(减少函数调用开销);使用类型声明(帮助Zend生成优化的opcode);使用const而不是define(常量更高效);避免使用eval和可变变量(破坏opcode缓存);在循环中缓存函数调用的结果(strlen在循环中被反复调用可以缓存);以及使用yield生成器处理大数据集(节省内存)。

Zend引擎是PHP的心脏,它的每次演进都带来PHP性能和能力的跃升。从PHP 4的简单解释器,到PHP 5的对象模型重构,到PHP 7的zval优化和AST引入,再到PHP 8的JIT,Zend引擎一直在进化。理解Zend引擎,就是理解PHP之所以成为PHP的根本原因。
参考:https://xrzqr.cn

目录
相关文章
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32710 80
如何保证分布式文件系统的数据一致性
|
前端开发 容器
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局(上)
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局
17766 21
|
设计模式 存储 监控
设计模式(C++版)
看懂UML类图和时序图30分钟学会UML类图设计原则单一职责原则定义:单一职责原则,所谓职责是指类变化的原因。如果一个类有多于一个的动机被改变,那么这个类就具有多于一个的职责。而单一职责原则就是指一个类或者模块应该有且只有一个改变的原因。bad case:IPhone类承担了协议管理(Dial、HangUp)、数据传送(Chat)。good case:里式替换原则定义:里氏代换原则(Liskov 
36694 21
设计模式(C++版)
|
存储 编译器 C语言
抽丝剥茧C语言(初阶 下)(下)
抽丝剥茧C语言(初阶 下)
|
机器学习/深度学习 人工智能 自然语言处理
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
24771 14
|
机器学习/深度学习 弹性计算 监控
重生之---我测阿里云U1实例(通用算力型)
阿里云产品全线降价的一力作,2023年4月阿里云推出新款通用算力型ECS云服务器Universal实例,该款服务器的真实表现如何?让我先测为敬!
36675 15
重生之---我测阿里云U1实例(通用算力型)
|
SQL 存储 弹性计算
Redis性能高30%,阿里云倚天ECS性能摸底和迁移实践
Redis在倚天ECS环境下与同规格的基于 x86 的 ECS 实例相比,Redis 部署在基于 Yitian 710 的 ECS 上可获得高达 30% 的吞吐量优势。成本方面基于倚天710的G8y实例售价比G7实例低23%,总性价比提高50%;按照相同算法,相对G8a,性价比为1.4倍左右。
|
存储 算法 Java
【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的限流器RateLimiter功能服务
随着互联网的快速发展,越来越多的应用程序需要处理大量的请求。如果没有限制,这些请求可能会导致应用程序崩溃或变得不可用。因此,限流器是一种非常重要的技术,可以帮助应用程序控制请求的数量和速率,以保持稳定和可靠的运行。
29845 52

热门文章

最新文章

下一篇
开通oss服务