PHP 性能分析与实验:性能的微观分析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

我们来了解 PHP 在使用和编写代码过程中,性能方面,可能需要注意和提升的地方。

在开始分析之前,我们得掌握一些与性能分析相关的函数。这些函数让我们对程序性能有更好的分析和评测。

一、性能分析相关的函数与命令

1.1、时间度量函数

平时我们常用 time() 函数,但是返回的是秒数,对于某段代码的内部性能分析,到秒的精度是不够的。于是要用 microtime 函数。而 microtime 函数可以返回两种形式,一是字符串的形式,一是浮点数的形式。不过需要注意的是,在缺省的情况下,返回的精度只有4位小数。为了获得更高的精确度,我们需要配置 precision。

如下是 microtime 的使用结果。

 
  1. $start= microtime(true);
  2. echo $start."\n";
  3. $end = microtime(true);
  4. echo $end."\n";
  5. echo ($end-$start)."\n";

输出为:

 
  1. bash-3.2# phptime.php
  2. 1441360050.3286 
  3. 1441360050.3292 
  4. 0.00053000450134277

而在代码前面加上一行:

 
  1. ini_set("precision", 16);

输出为:

 
  1. bash-3.2# phptime.php
  2. 1441360210.932628 
  3. 1441360210.932831 
  4. 0.0002031326293945312

除了 microtime 内部统计之外, 还可以使用 getrusage 来取得用户态的时长。在实际的操作中,也常用 time 命令来计算整个程序的运行时长,通过多次运行或者修改代码后运行,得到不同的时间长度以得到效率上的区别。 具体用法是:time phptime.php ,则在程序运行完成之后,不管是否正常结束退出,都会有相关的统计。

 
  1. bash-3.2# time phptime.php
  2. 1441360373.150756 
  3. 1441360373.150959 
  4. 0.0002031326293945312
  5. real 0m0.186s 
  6. user 0m0.072s 
  7. sys 0m0.077s

因为本文所讨论的性能问题,往往分析上百万次调用之后的差距与趋势,为了避免代码中存在一些时间统计代码,后面我们使用 time 命令居多。

1.2、内存使用相关函数

分析内存使用的函数有两个:memory_ get_ usage、memory_ get_ peak_usage,前者可以获得程序在调用的时间点,即当前所使用的内存,后者可以获得到目前为止高峰时期所使用的内存。所使用的内存以字节为单位。

 
  1. $base_memory= memory_get_usage();
  2. echo "Hello,world!\n";
  3. $end_memory= memory_get_usage();
  4. $peak_memory= memory_get_peak_usage();
  5. echo $base_memory,"\t",$end_memory,"\t",($end_memory-$base_memory),"\t", $peak_memory,"\n";

输出如下:

 
  1. bash-3.2# phphelloworld.php
  2. Hello,world! 
  3. 224400 224568 168 227424

可以看到,即使程序中间只输出了一句话,再加上变量存储,也消耗了168个字节的内存。

对于同一程序,不同 PHP 版本对内存的使用并不相同,甚至还差别很大。

 
  1. $baseMemory= memory_get_usage();
  2. class User
  3. {
  4. private $uid;
  5. function __construct($uid)
  6. {
  7. $this->uid= $uid;
  8. }
  9. }
  10. for($i=0;$i<100000;$i++)
  11. {
  12. $obj= new User($i);
  13. if ( $i% 10000 === 0 )
  14. {
  15. echo sprintf( '%6d: ', $i), memory_get_usage(), " bytes\n";
  16. }
  17. }
  18. echo " peak: ",memory_get_peak_usage(true), " bytes\n";

在 PHP 5.2 中,内存使用如下:

 
  1. [root@localhostphpperf]# php52 memory.php
  2. 0: 93784 bytes 
  3. 10000: 93784 bytes 
  4. …… 80000: 93784 bytes 
  5. 90000: 93784 bytes 
  6. peak: 262144 bytes

PHP 5.3 中,内存使用如下

 
  1. [root@localhostphpperf]# phpmemory.php
  2. 0: 634992 bytes 
  3. 10000: 634992 bytes 
  4. …… 80000: 634992 bytes 
  5. 90000: 634992 bytes 
  6. peak: 786432 bytes

可见 PHP 5.3 在内存使用上要粗放了一些。

PHP 5.4 - 5.6 差不多,有所优化:

 
  1. [root@localhostphpperf]# php56 memory.php
  2. 0: 224944 bytes 
  3. 10000: 224920 bytes 
  4. …… 80000: 224920 bytes 
  5. 90000: 224920 bytes 
  6. peak: 262144 bytes

而 PHP 7 在少量使用时,高峰内存的使用,增大很多。

 
  1. [root@localhostphpperf]# php7 memory.php
  2. 0: 353912 bytes 
  3. 10000: 353912 bytes 
  4. …… 80000: 353912 bytes 
  5. 90000: 353912 bytes 
  6. peak: 2097152 bytes

从上面也看到,以上所使用的 PHP 都有比较好的垃圾回收机制,10万次初始化,并没有随着对象初始化的增多而增加内存的使用。PHP7 的高峰内存使用最多,达到了接近 2M。

下面再来看一个例子,在上面的代码的基础上,我们加上一行,如下:

 
  1. $obj->self = $obj;

代码如下:

 
  1. $baseMemory= memory_get_usage();
  2. class User
  3. {
  4. private $uid;
  5. function __construct($uid)
  6. {
  7. $this->uid= $uid;
  8. }
  9. }
  10. for($i=0;$i<100000;$i++)
  11. {
  12. $obj= new User($i);
  13. $obj->self = $obj;
  14. if ( $i% 5000 === 0 )
  15. {
  16. echo sprintf( '%6d: ', $i), memory_get_usage(), " bytes\n";
  17. }
  18. }
  19. echo " peak: ",memory_get_peak_usage(true), " bytes\n";

这时候再来看看内存的使用情况,中间表格主体部分为内存使用量,单位为字节。

PHP性能分析与实验

PHP性能分析与实验

图表如下:

PHP性能分析与实验

PHP性能分析与实验

PHP 5.2 并没有合适的垃圾回收机制,导致内存使用越来越多。而5.3 以后内存回收机制导致内存稳定在一个区间。而也可以看见 PHP7 内存使用最少。把 PHP 5.2 的图形去掉了之后,对比更为明显。

PHP性能分析与实验

PHP性能分析与实验

可见 PHP7 不仅是在算法效率上,有大幅度的提升,在大批量内存使用上也有大幅度的优化(尽管小程序的高峰内存比历史版本所用内存更多)。

1.3、垃圾回收相关函数

在 PHP 中,内存回收是可以控制的,我们可以显式地关闭或者打开垃圾回收,一种方法是通过修改配置,zend.enable_gc=Off 就可以关掉垃圾回收。缺省情况下是 On 的。另外一种手段是通过 gc _enable()和gc _disable()函数分别打开和关闭垃圾回收。

比如在上面的例子的基础上,我们关闭垃圾回收,就可以得到如下数据表格和图表。

代码如下:

 
  1. gc_disable();
  2. $baseMemory= memory_get_usage();
  3. class User
  4. {
  5. private $uid;
  6. function __construct($uid)
  7. {
  8. $this->uid= $uid;
  9. }
  10. }
  11. for($i=0;$i<100000;$i++)
  12. {
  13. $obj= new User($i);
  14. $obj->self = $obj;
  15. if ( $i% 5000 === 0 )
  16. {
  17. echo sprintf( '%6d: ', $i), memory_get_usage(), " bytes\n";
  18. }
  19. }
  20. echo " peak: ",memory_get_peak_usage(true), " bytes\n";

分别在 PHP 5.3、PHP5.4 、PHP5.5、PHP5.6 、PHP7 下运行,得到如下内存使用统计表。

PHP性能分析与实验

PHP性能分析与实验

图表如下,PHP7 还是内存使用效率最优的。

从上面的例子也可以看出来,尽管在第一个例子中,PHP7 的高峰内存使用数是最多的,但是当内存使用得多时,PHP7 的内存优化就体现出来了。

这里值得一提的是垃圾回收,尽管会使内存减少,但是会导致速度降低,因为垃圾回收也是需要消耗 CPU 等其他系统资源的。Composer 项目就曾经因为在计算依赖前关闭垃圾回收,带来成倍性能提升,引发广大网友关注。详见:

https://github.com/composer/composer/commit/ac676f47f7bbc619678a29deae097b6b0710b799

在常见的代码和性能分析中,出了以上三类函数之外,还常使用的有堆栈跟踪函数、输出函数,这里不再赘述。

二、PHP 性能分析10则

下面我们根据小程序来验证一些常见的性能差别。

2.1、使用 echo 还是 print

在有的建议规则中,会建议使用 echo ,而不使用 print。说 print 是函数,而 echo 是语法结构。实际上并不是如此,print 也是语法结构,类似的语法结构,还有多个,比如 list、isset、require 等。不过对于 PHP 7 以下 PHP 版本而言,两者确实有性能上的差别。如下两份代码:

 
  1. for($i=0; $i<1000000; $i++)
  2. {
  3. echo("Hello,World!");
  4. }
  5. for($i=0; $i<1000000; $i++)
  6. {
  7. print ("Hello,World!");
  8. }

在 PHP 5.3 中运行速度分别如下(各2次):

 
  1. [root@localhostphpperf]# time php echo1.php > /dev/null
  2. real 0m0.233s 
  3. user 0m0.153s 
  4. sys 0m0.080s 
  5. [root@localhostphpperf]# time php echo1.php > /dev/null
  6. real 0m0.234s 
  7. user 0m0.159s 
  8. sys 0m0.073s 
  9. [root@localhostphpperf]# time phpecho.php> /dev/null
  10. real 0m0.203s 
  11. user 0m0.130s 
  12. sys 0m0.072s 
  13. [root@localhostphpperf]# time phpecho.php> /dev/null
  14. real 0m0.203s 
  15. user 0m0.128s 
  16. sys 0m0.075s

在 PHP5.3 版中效率差距10%以上。而在 PHP5.4 以上的版本中,区别不大,如下是 PHP7 中的运行效率。

 
  1. [root@localhostphpperf]# time php7 echo.php> /dev/null
  2. real 0m0.151s 
  3. user 0m0.088s 
  4. sys 0m0.062s 
  5. [root@localhostphpperf]# time php7 echo.php> /dev/null
  6. real 0m0.145s 
  7. user 0m0.084s 
  8. sys 0m0.061s
  9. [root@localhostphpperf]# time php7 echo1.php > /dev/null
  10. real 0m0.140s 
  11. user 0m0.075s 
  12. sys 0m0.064s 
  13. [root@localhostphpperf]# time php7 echo1.php > /dev/null
  14. real 0m0.146s 
  15. user 0m0.077s 
  16. sys 0m0.069s

正如浏览器前端的一些优化准则一样,没有啥特别通用的原则,往往根据不同的情况和版本,规则也会存在不同。

2.2、require 还是 require_once?

在一些常规的优化规则中,会提到,建议使用 require_ once 而不是 require,现由是 require_ once 会去检测是否重复,而 require 则不需要重复检测。

在大量不同文件的包含中,require_ once 略慢于 require。但是 require_ once 的检测是一项内存中的行为,也就是说即使有数个需要加载的文件,检测也只是内存中的比较。而 require 的每次重新加载,都会从文件系统中去读取分析。因而 require_ once 会比 require 更佳。咱们也使用一个例子来看一下。

 
  1. str.php
  2. global$str;
  3. $str= "China has a large population";
  4. require.php
  5. for($i=0; $i<100000; $i++) {
  6. require "str.php";
  7. }
  8. require_once.php
  9. for($i=0; $i<100000; $i++) {
  10. require_once"str.php";
  11. }

上面的例子,在 PHP7 中,require_ once.php 的运行速度是 require.php 的30倍!在其他版本也能得到大致相同的结果。

 
  1. [root@localhostphpperf]# time php7 require.php
  2. real 0m1.712s 
  3. user 0m1.126s 
  4. sys 0m0.569s 
  5. [root@localhostphpperf]# time php7 require.php
  6. real 0m1.640s 
  7. user 0m1.113s 
  8. sys 0m0.515s 
  9. [root@localhostphpperf]# time php7 require_once.php
  10. real 0m0.066s 
  11. user 0m0.063s 
  12. sys 0m0.003s 
  13. [root@localhostphpperf]# time php7 require_once.php
  14. real 0m0.057s 
  15. user 0m0.052s 
  16. sys 0m0.004s

从上可以看到,如果存在大量的重复加载的话,require_ once 明显优于 require,因为重复的文件不再有 IO 操作。即使不是大量重复的加载,也建议使用 require_ once,因为在一个程序中,一般不会存在数以千百计的文件包含,100次内存比较的速度差距,一个文件包含就相当了。

2.3、单引号还是双引号?

单引号,还是双引号,是一个问题。一般的建议是能使用单引号的地方,就不要使用双引号,因为字符串中的单引号,不会引起解析,从而效率更高。那来看一下实际的差别。

 
  1. classUser
  2. {
  3. private $uid;
  4. private $username;
  5. private $age;
  6. function __construct($uid, $username,$age){
  7. $this->uid= $uid;
  8. $this->username = $username;
  9. $this->age = $age;
  10. }
  11. function getUserInfo()
  12. {
  13. return "UID:".$this->uid." UserName:".$this->username." Age:".$this->age;
  14. }
  15. function getUserInfoSingle()
  16. {
  17. return 'UID:'.$this->uid.' UserName:'.$this->username.' Age'.$this->age;
  18. }
  19. function getUserInfoOnce()
  20. {
  21. return "UID:{$this->uid}UserName:{$this->username} Age:{$this->age}";
  22. }
  23. function getUserInfoSingle2()
  24. {
  25. return 'UID:{$this->uid} UserName:{$this->username} Age:{$this->age}';
  26. }
  27. }
  28. for($i=0; $i<1000000;$i++) {
  29. $user = new User($i, "name".$i, $i%100);
  30. $user->getUserInfoSingle();
  31. }

在上面的 User 类中,有四个不同的方法,完成一样的功能,就是拼接信息返回,看看这四个不同的方法的区别。

第一个、getUserInfo ,使用双引号和属性相拼接

 
  1. [root@localhostphpperf]# time php7 string.php
  2. real 0m0.670s 
  3. user 0m0.665s 
  4. sys 0m0.002s 
  5. [root@localhostphpperf]# time php7 string.php
  6. real 0m0.692s 
  7. user 0m0.689s 
  8. sys 0m0.002s 
  9. [root@localhostphpperf]# time php7 string.php
  10. real 0m0.683s 
  11. user 0m0.672s 
  12. sys 0m0.004s

第二个、getUserInfoSingle ,使用单引号和属性相拼接

 
  1. [root@localhostphpperf]# time php7 string.php
  2. real 0m0.686s 
  3. user 0m0.683s 
  4. sys 0m0.001s 
  5. [root@localhostphpperf]# time php7 string.php
  6. real 0m0.671s 
  7. user 0m0.666s 
  8. sys 0m0.003s 
  9. [root@localhostphpperf]# time php7 string.php
  10. real 0m0.669s 
  11. user 0m0.666s 
  12. sys 0m0.002s

可见在拼接中,单双引号并无明显差别。

第三个、getUserInfoOnce,不再使用句号.连接,而是直接引入在字符串中解析。

 
  1. [root@localhostphpperf]# time php7 string.php
  2. real 0m0.564s 
  3. user 0m0.556s 
  4. sys 0m0.006s 
  5. [root@localhostphpperf]# time php7 string.php
  6. real 0m0.592s 
  7. user 0m0.587s 
  8. sys 0m0.004s 
  9. [root@localhostphpperf]# time php7 string.php
  10. real 0m0.563s 
  11. user 0m0.559s 
  12. sys 0m0.003s

从上面可见,速度提高了0.06s-0.10s,有10%-20%的效率提升。可见连缀效率更低一些。

第四个、getUserInfoSingle2 虽然没有达到我们真正想要的效果,功能是不正确的,但是在字符串中,不再需要解析变量和获取变量值,所以效率确实有大幅度提升。

 
  1. [root@localhostphpperf]# time php7 string.php
  2. real 0m0.379s 
  3. user 0m0.375s 
  4. sys 0m0.003s 
  5. [root@localhostphpperf]# time php7 string.php
  6. real 0m0.399s 
  7. user 0m0.394s 
  8. sys 0m0.003s 
  9. [root@localhostphpperf]# time php7 string.php
  10. real 0m0.377s 
  11. user 0m0.371s 
  12. sys 0m0.004s

效率确实有了大的提升,快了50%。

那么这个快,是由于不需要变量引用解析带来的,还是只要加入$天然的呢?我们再试着写了一个方法。

 
  1. functiongetUserInfoSingle3()
  2. {
  3. return "UID:{\$this->uid} UserName:{\$this->username} Age:{\$this->age}";
  4. }

得到如下运行时间:

 
  1. [root@localhostphpperf]# time php7 string.php
  2. real 0m0.385s 
  3. user 0m0.381s 
  4. sys 0m0.002s 
  5. [root@localhostphpperf]# time php7 string.php
  6. real 0m0.382s 
  7. user 0m0.380s 
  8. sys 0m0.002s 
  9. [root@localhostphpperf]# time php7 string.php
  10. real 0m0.386s 
  11. user 0m0.380s 
  12. sys 0m0.004s

发现转义后的字符串,效率跟单引号是一致的,从这里也可以看见,单引号还是双引号包含,如果不存在需要解析的变量,几乎没有差别。如果有需要解析的变量,你也不能光用单引号,要么使用单引号和连缀,要么使用内部插值,所以在这条规则上,不用太过纠结。

2.4、错误应该打开还是关闭?

在 PHP 中,有多种错误消息,错误消息的开启是否会带来性能上的影响呢?从直觉觉得,由于错误消息,本身会涉及到 IO 输出,无论是输出到终端或者 error_log,都是如此,所以肯定会影响性能。我们来看看这个影响有多大。

 
  1. error_reporting(E_ERROR);
  2. for($i=0; $i<1000000;$i++) {
  3. $str= "通常,$PHP中的垃圾回收机制,仅仅在循环回收算法确实运行时会有时间消耗上的增加。但是在平常的(更小的)脚本中应根本就没有性能影响。
  4. 然而,在平常脚本中有循环回收机制运行的情况下,内存的节省将允许更多这种脚本同时运行在你的服务器上。因为总共使用的内存没达到上限。";
  5. }

在上面的代码中,我们涉及到一个不存在的变量,所以会报出 Notice 错误:

 
  1. Notice: Undefined variable: PHP 中的垃圾回收机制,仅仅在循环回收算法确实运行时会有时间消耗上的增加。但是在平常的 in xxxx/string2.php on line 10

如果把 E_ ERROR 改成 E_ ALL 就能看到大量的上述错误输出。

我们先执行 E_ ERROR 版,这个时候没有任何错误日志输出。得到如下数据:

 
  1. [root@localhostphpperf]# time php7 string2.php
  2. real 0m0.442s 
  3. user 0m0.434s 
  4. sys 0m0.005s 
  5. [root@localhostphpperf]# time php7 string2.php
  6. real 0m0.487s 
  7. user 0m0.484s 
  8. sys 0m0.002s 
  9. [root@localhostphpperf]# time php7 string2.php
  10. real 0m0.476s 
  11. user 0m0.471s 
  12. sys 0m0.003s

再执行 E_ ALL 版,有大量的错误日志输出,我们把输出重定向到/dev/null

 
  1. [root@localhostphpperf]# time php7 string2.php > /dev/null
  2. real 0m0.928s 
  3. user 0m0.873s 
  4. sys 0m0.051s 
  5. [root@localhostphpperf]# time php7 string2.php > /dev/null
  6. real 0m0.984s 
  7. user 0m0.917s 
  8. sys 0m0.064s 
  9. [root@localhostphpperf]# time php7 string2.php > /dev/null
  10. real 0m0.945s 
  11. user 0m0.887s 
  12. sys 0m0.056s

可见慢了将近一倍。

如上可见,即使输出没有正式写入文件,错误级别打开的影响也是巨大的。在线上我们应该将错误级别调到 E_ ERROR 这个级别,同时将错误写入 error_ log,既减少了不必要的错误信息输出,又避免泄漏路径等信息,造成安全隐患。

2.5、正则表达式和普通字符串操作

在字符串操作中,有一条常见的规则,即是能使用普通字符串操作方法替代的,就不要使用正则表达式来处理,用 C 语言操作 PCRE 做过正则表达式处理的童鞋应该清楚,需要先 compile,再 exec,也就是说是一个相对复杂的过程。现在就比较一下两者的差别。

对于简单的分隔,我们可以使用 explode 来实现,也可以使用正则表达式,比如下面的例子:

 
  1. ini_set("precision", 16);
  2. function microtime_ex()
  3. {
  4. list($usec, $sec) = explode(" ", microtime());
  5. return $sec+$usec;
  6. }
  7. for($i=0; $i<1000000; $i++) {
  8. microtime_ex();
  9. }

耗时在0.93-1S之间。

 
  1. [root@localhostphpperf]# time php7 pregstring.php
  2. real 0m0.941s 
  3. user 0m0.931s 
  4. sys 0m0.007s 
  5. [root@localhostphpperf]# time php7 pregstring.php
  6. real 0m0.986s 
  7. user 0m0.980s 
  8. sys 0m0.004s 
  9. [root@localhostphpperf]# time php7 pregstring.php
  10. real 0m1.004s 
  11. user 0m0.998s 
  12. sys 0m0.003s

我们再将分隔语句替换成:

 
  1. list($usec, $sec) = preg_split("#\s#", microtime());

得到如下数据,慢了近10-20%。

 
  1. [root@localhostphpperf]# time php7 pregstring1.php
  2. real 0m1.195s 
  3. user 0m1.182s 
  4. sys 0m0.004s 
  5. [root@localhostphpperf]# time php7 pregstring1.php
  6. real 0m1.222s 
  7. user 0m1.217s 
  8. sys 0m0.003s 
  9. [root@localhostphpperf]# time php7 pregstring1.php
  10. real 0m1.101s 
  11. user 0m1.091s 
  12. sys 0m0.005s

再将语句替换成:

 
  1. list($usec, $sec) = preg_split("#\s+#", microtime());

即匹配一到多个空格,并没有太多的影响。除了分隔外,查找我们也来看一个例子。

第一段代码:

 
  1. $str= "China has a Large population";
  2. for($i=0; $i<1000000; $i++) {
  3. if(preg_match("#l#i", $str))
  4. {
  5. }
  6. }

第二段代码:

 
  1. $str= "China has a large population";
  2. for($i=0; $i<1000000; $i++) {
  3. if(stripos($str, "l")!==false)
  4. {
  5. }
  6. }

这两段代码达到的效果相同,都是查找字符串中有无 l 或者 L 字符。

在 PHP 7 下运行效果如下:

 
  1. [root@localhostphpperf]# time php7 pregstring2.php
  2. real 0m0.172s 
  3. user 0m0.167s 
  4. sys 0m0.003s 
  5. [root@localhostphpperf]# time php7 pregstring2.php
  6. real 0m0.199s 
  7. user 0m0.196s 
  8. sys 0m0.002s 
  9. [root@localhostphpperf]# time php7 pregstring3.php
  10. real 0m0.185s 
  11. user 0m0.182s 
  12. sys 0m0.003s 
  13. [root@localhostphpperf]# time php7 pregstring3.php
  14. real 0m0.184s 
  15. user 0m0.181s 
  16. sys 0m0.003s

两者区别不大。再看看在 PHP5.6 中的表现。

 
  1. [root@localhostphpperf]# time php56 pregstring2.php
  2. real 0m0.470s 
  3. user 0m0.456s 
  4. sys 0m0.004s 
  5. [root@localhostphpperf]# time php56 pregstring2.php
  6. real 0m0.506s 
  7. user 0m0.500s 
  8. sys 0m0.005s 
  9. [root@localhostphpperf]# time php56 pregstring3.php
  10. real 0m0.348s 
  11. user 0m0.342s 
  12. sys 0m0.004s 
  13. [root@localhostphpperf]# time php56 pregstring3.php
  14. real 0m0.376s 
  15. user 0m0.364s 
  16. sys 0m0.003s

可见在 PHP 5.6 中表现还是非常明显的,使用正则表达式慢了20%。PHP7 难道是对已使用过的正则表达式做了缓存?我们调整一下代码如下:

 
  1. $str= "China has a Large population";
  2. for($i=0; $i<1000000; $i++) {
  3. $pattern = "#".chr(ord('a')+$i%26)."#i";
  4. if($ret = preg_match($pattern, $str)!==false)
  5. {
  6. }
  7. }

这是一个动态编译的 pattern。

 
  1. $str= "China has a large population";
  2. for($i=0; $i<1000000; $i++) {
  3. $pattern = "".chr(ord('a')+$i%26)."";
  4. if($ret = stripos($str, $pattern)!==false)
  5. {
  6. }
  7. }

在 PHP7 中,得到了如下结果:

 
  1. [root@localhostphpperf]# time php7 pregstring2.php
  2. real 0m0.351s 
  3. user 0m0.346s 
  4. sys 0m0.004s 
  5. [root@localhostphpperf]# time php7 pregstring2.php
  6. real 0m0.359s 
  7. user 0m0.352s 
  8. sys 0m0.004s 
  9. [root@localhostphpperf]# time php7 pregstring3.php
  10. real 0m0.375s 
  11. user 0m0.369s 
  12. sys 0m0.003s 
  13. [root@localhostphpperf]# time php7 pregstring3.php
  14. real 0m0.370s 
  15. user 0m0.365s 
  16. sys 0m0.005s

可见两者并不明显。而在 PHP 5.6 中,同样的代码:

 
  1. [root@localhostphpperf]# time php56 pregstring2.php
  2. real 0m1.022s 
  3. user 0m1.015s 
  4. sys 0m0.005s 
  5. [root@localhostphpperf]# time php56 pregstring2.php
  6. real 0m1.049s 
  7. user 0m1.041s 
  8. sys 0m0.005s 
  9. [root@localhostphpperf]# time php56 pregstring3.php
  10. real 0m0.923s 
  11. user 0m0.821s 
  12. sys 0m0.002s 
  13. [root@localhostphpperf]# time php56 pregstring3.php
  14. real 0m0.838s 
  15. user 0m0.831s 
  16. sys 0m0.004s

在 PHP 5.6 中,stripos 版明显要快于正则表达式版,由上两例可见,PHP7对正则表达式的优化还是相当惊人的。其次也建议,能用普通字符串操作的地方,可以避免使用正则表达式。因为在其他版本中,这个规则还是适用的。某 zend 大牛官方的分享给出如下数据:

  • stripos(‘http://’, $website) 速度是preg_match(‘/http:\/\//i’, $website) 的两倍
  • ctype_alnum()速度是preg_match(‘/^\s*$/’)的5倍;
  • “if ($test == (int)$test)” 比 preg_match(‘/^\d*$/’)快5倍

可以相见,正则表达式是相对低效的。

2.6、数组元素定位查找

在数组元素的查找中,有一个关键的注意点就是数组值和键的查找速度,差异非常大。了解过 PHP 扩展开发的朋友,应该清楚,数组在底层其实是 Hash 表。所以键是以快速定位的,而值却未必。下面来看例子。

首先们构造一个数组:

 
  1. $a= array();
  2. for($i=0;$i<100000;$i++){
  3. $a[$i] = $i;
  4. }

在这个数组中,我们测试查找值和查找键的效率差别。

第一种方法用 array_ search,第二种用 array_ key_ exists,第三种用 isset 语法结构。 代码分别如下:

 
  1. //查找值
  2. foreach($a as $i)
  3. {
  4. array_search($i, $a);
  5. }
  6. //查找键
  7. foreach($a as $i)
  8. {
  9. array_key_exists($i, $a);
  10. }
  11. //判定键是否存在
  12. foreach($a as $i)
  13. {
  14. if(isset($a[$i]));
  15. }

运行结果如下:

 
  1. [root@localhostphpperf]# time php7 array.php
  2. real 0m9.026s 
  3. user 0m8.965s 
  4. sys 0m0.007s 
  5. [root@localhostphpperf]# time php7 array.php
  6. real 0m9.063s 
  7. user 0m8.965s 
  8. sys 0m0.005s 
  9. [root@localhostphpperf]# time php7 array1.php
  10. real 0m0.018s 
  11. user 0m0.016s 
  12. sys 0m0.001s 
  13. [root@localhostphpperf]# time php7 array1.php
  14. real 0m0.021s 
  15. user 0m0.015s 
  16. sys 0m0.004s 
  17. [root@localhostphpperf]# time php7 array2.php
  18. real 0m0.020s 
  19. user 0m0.014s 
  20. sys 0m0.006s 
  21. [root@localhostphpperf]# time php7 array2.php
  22. real 0m0.016s 
  23. user 0m0.009s 
  24. sys 0m0.006s

由上例子可见,键值查找的速度比值查找的速度有百倍以上的效率差别。因而如果能用键值定位的地方,尽量用键值定位,而不是值查找。

2.7、对象与数组

在 PHP 中,数组就是字典,字典可以存储属性和属性值,而且无论是键还是值,都不要求数据类型统一,所以对象数据存储,既能用对象数据结构的属性存储数据,也能使用数组的元素存储数据。那么两者有何差别呢?

使用对象:

 
  1. classUser
  2. {
  3. public $uid;
  4. public $username;
  5. public $age;
  6. function getUserInfo()
  7. {
  8. return "UID:".$this->uid." UserName:".$this->username." Age:".$this->age;
  9. }
  10. }
  11. for($i=0; $i<1000000;$i++) {
  12. $user = new User();
  13. $user->uid= $i;
  14. $user->age = $i%100;
  15. $user->username="User".$i;
  16. $user->getUserInfo();
  17. }

使用数组:

 
  1. functiongetUserInfo($user)
  2. {
  3. return "UID:".$user['uid']." UserName:".$user['username']." Age:".$user['age'];
  4. }
  5. for($i=0; $i<1000000;$i++) {
  6. $user = array("uid"=>$i,"age" =>$i%100,"username"=>"User".$i);
  7. getUserInfo($user);
  8. }

我们分别在 PHP5.3、PHP 5.6 和 PHP 7 中运行这两段代码。

 
  1. [root@localhostphpperf]# time phpobject.php
  2. real 0m2.144s 
  3. user 0m2.119s 
  4. sys 0m0.009s 
  5. [root@localhostphpperf]# time phpobject.php
  6. real 0m2.106s 
  7. user 0m2.089s 
  8. sys 0m0.013s 
  9. [root@localhostphpperf]# time php object1.php
  10. real 0m1.421s 
  11. user 0m1.402s 
  12. sys 0m0.016s 
  13. [root@localhostphpperf]# time php object1.php
  14. real 0m1.431s 
  15. user 0m1.410s 
  16. sys 0m0.012s

在 PHP 5.3 中,数组版比对象版快了近30%。

 
  1. [root@localhostphpperf]# time php56 object.php
  2. real 0m1.323s 
  3. user 0m1.319s 
  4. sys 0m0.002s 
  5. [root@localhostphpperf]# time php56 object.php
  6. real 0m1.414s 
  7. user 0m1.400s 
  8. sys 0m0.006s 
  9. [root@localhostphpperf]# time php56 object1.php
  10. real 0m1.356s 
  11. user 0m1.352s 
  12. sys 0m0.002s 
  13. [root@localhostphpperf]# time php56 object1.php
  14. real 0m1.364s 
  15. user 0m1.349s 
  16. sys 0m0.006s 
  17. [root@localhostphpperf]# time php7 object.php
  18. real 0m0.642s 
  19. user 0m0.638s 
  20. sys 0m0.003s 
  21. [root@localhostphpperf]# time php7 object.php
  22. real 0m0.606s 
  23. user 0m0.602s 
  24. sys 0m0.003s 
  25. [root@localhostphpperf]# time php7 object1.php
  26. real 0m0.615s 
  27. user 0m0.613s 
  28. sys 0m0.000s 
  29. [root@localhostphpperf]# time php7 object1.php
  30. real 0m0.615s 
  31. user 0m0.611s 
  32. sys 0m0.003s

到了 PHP 5.6 和 PHP7 中,两个版本基本没有差别,而在 PHP7 中的速度是 PHP5.6 中的2倍。在新的版本中,差别已几乎没有,那么为了清楚起见我们当然应该声明类,实例化类来存储对象数据。

2.8、getter 和 setter

从 Java 转过来学习 PHP 的朋友,在对象声明时,可能习惯使用 getter 和 setter,那么,在 PHP 中,使用 getter 和 setter 是否会带来性能上的损失呢?同样,先上例子。

无 setter版:

 
  1. classUser
  2. {
  3. public $uid;
  4. public $username;
  5. public $age;
  6. function getUserInfo()
  7. {
  8. return "UID:".$this->uid." UserName:".$this->username." Age:".$this->age;
  9. }
  10. }
  11. for($i=0; $i<1000000;$i++) {
  12. $user = new User();
  13. $user->uid= $i;
  14. $user->age = $i%100;
  15. $user->username="User".$i;
  16. $user->getUserInfo();
  17. }

有 setter版:

 
  1. classUser
  2. {
  3. public $uid;
  4. private $username;
  5. public $age;
  6. function setUserName($name)
  7. {
  8. $this->username = $name;
  9. }
  10. function getUserInfo()
  11. {
  12. return "UID:".$this->uid." UserName:".$this->username." Age:".$this->age;
  13. }
  14. }
  15. for($i=0; $i<1000000;$i++) {
  16. $user = new User();
  17. $user->uid= $i;
  18. $user->age = $i%100;
  19. $user->setUserName("User".$i);
  20. $user->getUserInfo();
  21. }

这里只增加了一个 setter。运行结果如下:

 
  1. [root@localhostphpperf]# time php7 object.php
  2. real 0m0.607s 
  3. user 0m0.602s 
  4. sys 0m0.004s 
  5. [root@localhostphpperf]# time php7 object.php
  6. real 0m0.598s 
  7. user 0m0.596s 
  8. sys 0m0.000s 
  9. [root@localhostphpperf]# time php7 object2.php
  10. real 0m0.673s 
  11. user 0m0.669s 
  12. sys 0m0.003s 
  13. [root@localhostphpperf]# time php7 object2.php
  14. real 0m0.668s 
  15. user 0m0.664s 
  16. sys 0m0.004s

从上面可以看到,增加了一个 setter,带来了近10%的效率损失。可见这个性能损失是相当大的,在 PHP 中,我们没有必要再来做 setter 和 getter了。需要引用的属性,直接使用即可。

2.9、类属性该声明还是不声明

PHP 本身支持属性可以在使用时增加,也就是不声明属性,可以在运行时添加属性。那么问题来了,事先声明属性与事后增加属性,是否会有性能上的差别。这里也举一个例子探讨一下。

事先声明了属性的代码就是2.8节中,无 setter 的代码,不再重复。而无属性声明的代码如下:

 
  1. classUser
  2. {
  3. function getUserInfo()
  4. {
  5. return "UID:".$this->uid." UserName:".$this->username." Age:".$this->age;
  6. }
  7. }
  8. for($i=0; $i<1000000;$i++) {
  9. $user = new User();
  10. $user->uid= $i;
  11. $user->age = $i%100;
  12. $user->username="User".$i;
  13. $user->getUserInfo();
  14. }

两段代码,运行结果如下:

 
  1. [root@localhostphpperf]# time php7 object.php
  2. real 0m0.608s 
  3. user 0m0.604s 
  4. sys 0m0.003s 
  5. [root@localhostphpperf]# time php7 object.php
  6. real 0m0.615s 
  7. user 0m0.605s 
  8. sys 0m0.003s 
  9. [root@localhostphpperf]# time php7 object3.php
  10. real 0m0.733s 
  11. user 0m0.728s 
  12. sys 0m0.004s 
  13. [root@localhostphpperf]# time php7 object3.php
  14. real 0m0.727s 
  15. user 0m0.720s 
  16. sys 0m0.004s

从上面的运行可以看到,无属性声明的代码慢了20%。可以推断出来的就是对于对象的属性,如果事先知道的话,我们还是事先声明的好,这一方面是效率问题,另一方面,也有助于提高代码的可读性呢。

2.10、图片操作 API 的效率差别

在图片处理操作中,一个非常常见的操作是将图片缩放成小图。缩放成小图的办法有多种,有使用 API 的,有使用命令行的。在 PHP 中,有 imagick 和 gmagick 两个扩展可供操作,而命令行则一般使用 convert 命令来处理。我们这里来讨论使用 imagick 扩展中的 API 处理图片的效率差别。

先上代码:

 
  1. function imagick_resize($filename, $outname)
  2. {
  3. $thumbnail = new Imagick($filename);
  4. $thumbnail->resizeImage(200, 200, imagick::FILTER_LANCZOS, 1);
  5. $thumbnail->writeImage($outname);
  6. unset($thumbnail);
  7. }
  8. function imagick_scale($filename, $outname)
  9. {
  10. $thumbnail = new Imagick($filename);
  11. $thumbnail->scaleImage(200, 200);
  12. $thumbnail->writeImage($outname);
  13. unset($thumbnail);
  14. }
  15. function convert($func)
  16. {
  17. $cmd= "find /var/data/ppt |grep jpg";
  18. $start = microtime(true);
  19. exec($cmd, $files);
  20. $index = 0;
  21. foreach($files as $key =>$filename)
  22. {
  23. $outname= " /tmp/$func"."_"."$key.jpg";
  24. $func($filename, $outname);
  25. $index++;
  26. }
  27. $end = microtime(true);
  28. echo "$func $index files: " . ($end- $start) . "s\n";
  29. }
  30. convert("imagick_resize");
  31. convert("imagick_scale");

在上面的代码中,我们分别使用了 resizeImage 和 scaleImage 来进行图片的压缩,压缩的是常见的 1-3M 之间的数码相机图片,得到如下运行结果:

 
  1. [root@localhostphpperf]# php55 imagick.php
  2. imagick_ resize 169 files: 5.0612308979034s 
  3. imagick_ scale 169 files: 3.1105840206146s
  4. [root@localhostphpperf]# php55 imagick.php
  5. imagick_ resize 169 files: 4.4953861236572s 
  6. imagick_ scale 169 files: 3.1514940261841s
  7. [root@localhostphpperf]# php55 imagick.php
  8. imagick_ resize 169 files: 4.5400381088257s 
  9. imagick_ scale 169 files: 3.2625908851624s

169张图片压缩,使用 resizeImage 压缩,速度在4.5S以上,而使用 scaleImage 则在 3.2S 左右,快了将近50%,压缩的效果,用肉眼看不出明显区别。当然 resizeImage 的控制能力更强,不过对于批量处理而言,使用 scaleImage 是更好的选择,尤其对头像压缩这种频繁大量的操作。本节只是例举了图片压缩 API 作为例子,也正像 explode 和 preg_ split 一样,在 PHP 中,完成同样一件事情,往往有多种手法。建议采用效率高的做法。

以上就是关于 PHP 开发的10个方面的对比,这些点涉及到 PHP 语法、写法以及 API 的使用。有些策略随着 PHP 的发展,有的已经不再适用,有些策略则会一直有用。

有童鞋也许会说,在现实的开发应用中,上面的某些观点和解决策略,有点「然并卵」。为什么这么说呢?因为在一个程序的性能瓶颈中,最为核心的瓶颈,往往并不在 PHP 语言本身。即使是跟 PHP 代码中暴露出来的性能瓶颈,也常在外部资源和程序的不良写法导致的瓶颈上。于是为了做好性能分析,我们需要向 PHP 的上下游戏延伸,比如延伸到后端的服务上去,比如延伸到前端的优化规则。在这两块,都有了相当多的积累和分析,雅虎也据此提出了多达35条前端优化规则,这些同 PHP 本身的性能分析构成了一个整体,就是降低用户的访问延时。

所以前面两部分所述的性能分析,只是有助于大家了解 PHP 开发本身,写出更好的 PHP 程序,为你成为一个资深的 PHP 程序员打下基础,对于实际生产中程序的效率提升,往往帮助也不是特别显著,因为大家也看到,在文章的实例中,很多操作往往是百万次才能看出明显的性能差别。在现实的页面中,每一个请求很快执行完成,对这些基础代码的调用,往往不会有这么多次调用。不过了解这些,总是好的。

那么,对于一个程序而言,其他的性能瓶颈可能存在哪里?我们将深入探讨。所以在本系列的下两篇,我们将探讨 PHP 程序的外围效源的效率问题和前端效率问题,敬请期待。


本文来自云栖社区合作伙伴“Linux中国”,原文发布日期:2015-09-13  

目录
相关文章
|
13天前
|
安全 测试技术 PHP
如何评估PHP框架的性能?
【9月更文挑战第2天】如何评估PHP框架的性能?
34 5
|
2月前
|
编译器 PHP 开发者
探索PHP 8的新特性与性能优化技巧
【7月更文挑战第19天】在数字时代的浪潮中,PHP作为一门广泛使用的服务器端脚本语言,其最新版本PHP 8的发布引起了开发者社区的广泛关注。本文将深入探讨PHP 8引入的一系列新特性,包括但不限于JIT编译器、联合类型、命名参数、匹配表达式等,并分享如何利用这些新工具提升代码的性能和可维护性。同时,我们还将讨论一些实用的性能优化技巧,帮助开发者写出更加高效、稳定的PHP应用。
|
30天前
|
SQL 缓存 数据库连接
拯救php性能的神器webman-数据库
Webman 框架与这些最佳数据库管理实践的结合,可为应用程序提供快速响应的用户体验,高吞吐量,提升应用程序的整体性能表现。在对数据库交互进行设计和开发时,持续关注性能指标和优化,确保数据库层面不会成为应用程序的瓶颈,这样便能充分利用 Webman 来提升 PHP 应用的性能。
57 4
|
27天前
|
存储 缓存 Java
性能分析之构建 Linux 操作系统分析决策树
【8月更文挑战第16天】性能分析之构建 Linux 操作系统分析决策树
27 0
性能分析之构建 Linux 操作系统分析决策树
|
1月前
|
存储 前端开发 JavaScript
优化PHP代码性能
【8月更文挑战第3天】优化PHP代码性能
40 16
|
1月前
|
存储 缓存 自然语言处理
|
14天前
|
安全 Java 云计算
JSF 应用究竟何去何从?云端部署能否成为其全新突破点?快来一探究竟!
【8月更文挑战第31天】本文介绍了将JavaServer Faces(JSF)应用部署到云平台的过程。首先,根据成本、功能、可靠性和安全性选择合适的云平台。接着,展示了构建简单JSF应用的示例代码。最后,以AWS Elastic Beanstalk为例,详细说明了部署流程。部署至云端可提升应用的可用性、扩展性和安全性。
28 0
|
2月前
|
缓存 安全 测试技术
深入PHP 7:新特性与性能提升解析
在PHP 7的发布中,我们见证了一系列令人兴奋的性能改进和新特性的加入。本文将深入探讨这些变化如何影响开发者的日常编程实践,并展示通过实际例子如何最大化利用PHP 7的优势。准备好迎接代码效率和开发体验的全新升级!
|
2月前
|
存储 监控 大数据
深入理解PHP 7的新特性及其性能优化技巧
【7月更文挑战第26天】随着PHP 7的发布,这一广泛使用的编程语言迎来了重大的性能提升和新特性。本文将深入探讨PHP 7的核心改进点,包括性能提升的原因、新引入的语言特性以及如何利用这些变化来优化现有和未来的PHP项目。我们将通过实际代码示例和性能分析工具来展示如何有效地应用这些新特性以达到最佳的性能表现。
|
2月前
|
缓存 IDE 编译器
深入理解PHP 7的新特性及其性能优化技巧
【7月更文挑战第21天】本文旨在探索PHP 7版本中引入的关键新特性,并结合实例分析这些特性如何提升开发效率与应用性能。我们将从类型声明的强化、抽象语法树(AST)的运用到错误处理机制的改进等方面进行讨论,同时揭示性能优化的实用技巧,帮助开发者充分利用PHP 7的强大功能。