代码执行的效率

简介:

第一个例子

PHP中Getter和Setter的效率来源reddit

这个例子比较简单,你可以跳过。

考虑下面的PHP代码:我们可看到,使用Getter/Setter的方式,性能要比直接读写成员变量要差一倍以上。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
<?php
     //dog_naive.php
 
     class  dog {
         public  $name  = "" ;
         public  function  setName( $name ) {
             $this -&gt;name = $name ;
         }
         public  function  getName() {
             return  $this -&gt;name;
         }
     }
 
     $rover  = new  dog();
         //通过Getter/Setter方式
     for  ( $x =0; $x <10; $x ++) {
         $t  = microtime(true);
         for  ( $i =0; $i <1000000; $i ++) {
             $rover ->setName( "rover" );
             $n  = $rover ->getName();
         }
         echo  microtime(true) - $t ;
         echo  "\n" ;
     }
         //直接存取变量方式
         for  ( $x =0; $x <10; $x ++) {
         $t  = microtime(true);
         for ( $i =0; $i <1000000; $i ++) {
             $rover ->name = "rover" ;
             $n  = $rover ->name;
         }
         echo  microtime(true) - $t ;
         echo  "\n" ;
     }
?>

这个并没有什么稀,因为有函数调用的开销,函数调用需要压栈出栈,需要传值,有时还要需要中断,要干的事太多了。所以,代码多了,效率自然就慢了。所有的语言都这个德行,这就是为什么C++要引入inline的原因。而且Java在打开优化的时候也可以优化之。但是对于动态语言来说,这个事就变得有点困难了。

 

你可能会以为使用下面的代码(Magic Function)会好一些,但实际其性能更差。

1
2
3
4
5
6
7
8
9
class  dog {
     private  $_name  = "" ;
     function  __set( $property , $value ) {
         if ( $property  == 'name' ) $this ->_name = $value ;
     }
     function  __get( $property ) {
         if ( $property  == 'name' ) return  $this ->_name;
     }
}

动态语言的效率从来都是一个问题,如果你需要PHP有更好的性能,你可能需要使用FaceBook的HipHop来把PHP编译成C语言。

第二个例子

为什么Python程序在函数内执行得更快?来源StackOverflow

考虑下面的代码,一个在函数体内,一个是全局的代码。

函数内的代码执行效率为 1.8s

1
2
3
4
def  main():
     for  i in  xrange ( 10 * * 8 ):
         pass
main()

函数体外的代码执行效率为 4.5s

1
2
for  i in  xrange ( 10 * * 8 ):
     pass

不用太纠结时间,只是一个示例,我们可以看到效率查得很多。为什么会这样呢?我们使用 dis module 反汇编函数体内的bytecode 代码,使用 compile builtin 反汇编全局bytecode,我们可以看到下面的反汇编(注意我高亮的地方)

Main函数反汇编
1
2
3
13 FOR_ITER                 6 (to 22)
16 STORE_FAST               1 (i)
19 JUMP_ABSOLUTE           13
全局代码
1
2
3
13 FOR_ITER                 6 (to 22)
16 STORE_NAME               1 (i)
19 JUMP_ABSOLUTE           13

我们可以看到,差别就是 STORE_FAST 和 STORE_NAME,前者比后者快很多。所以,在全局代码中,变量i成了一个全局变量,而函数中的i是放在本地变量表中,所以在全局变量表中查找变量就慢很多。如果你在main函数中声明global i 那么效率也就下来了。原因是,本地变量是存在一个数组中(直到),用一个整型常量去访问,而全局变量存在一个dictionary中,查询很慢。

(注:在C/C++中,这个不是一个问题)

第三个例子

为什么排好序的数据在遍历时会更快?来源StackOverflow

参看如下C/C++的代码:

1
2
3
4
5
6
7
for  (unsigned i = 0; i < 100000; ++i) {
    // primary loop
     for  (unsigned j = 0; j < arraySize; ++j) {
         if  (data[j] >= 128)
             sum += data[j];
     }
}

如果你的data数组是排好序的,那么性能是1.93s,如果没有排序,性能为11.54秒。差5倍多。无论是C/C++/Java,或是别的什么语言都基本上一样。

这个问题的原因是—— branch prediction (分支预判)伟大的stackoverflow给了一个非常不错的解释。

考虑我们一个铁路分叉,当我们的列车来的时候, 扳道员知道分个分叉通往哪,但不知道这个列车要去哪儿,司机知道要去哪,但是不知道走哪条分叉。所以,我们需要让列车停下来,然后司机和扳道员沟通一下。这样的性能太差了。

所以,我们可以优化一下,那就是猜,我们至少有50%的概率猜对,如果猜对了,火车行驶性能巨高,猜错了,就得让火车退回来。如果我猜对的概率高,那么,我们的性能就会高,否则老是猜错了,性能就很差。

Image by Mecanismo, from Wikimedia Commons:http://commons.wikimedia.org/wiki/File:Entroncamento_do_Transpraia.JPG

我们的if-else 就像这个铁路分叉一样,下面红箭头所指的就是搬道器。

那么,我们的搬道器是怎么预判的呢?就是使用过去的历史数据,如果历史数据有90%以上的走左边,那么就走左边。所以,我们排好序的数据就更容易猜得对。

排好序的
1
2
3
4
5
6
7
T = 走分支(条件表达式为 true
N = 不走分支(条件表达式为 false )
 
data[] = 0, 1, 2, 3, 4, ... 126, 127, 128, 129, 130, ... 250, 251, 252, ...
branch = N  N  N  N  N  ...   N    N    T    T    T  ...   T    T    T  ...
 
= NNNNNNNNNNNN ... NNNNNNNTTTTTTTTT ... TTTTTTTTTT  (easy to predict)
未排序的
1
2
3
4
data[] = 226, 185, 125, 158, 198, 144, 217, 79, 202, 118,  14, 150, 177, 182, 133, ...
branch =   T,   T,   N,   T,   T,   T,   T,  N,   T,   N,   N,   T,   T,   T,   N  ...
 
= TTNTTTTNTNNTTTN ...   (completely random - hard to predict)

从上面我们可以看到,排好序的数据更容易预测分支。

对此,那我们怎么办?我们需要在这种循环中除去if-else语句。比如:

我们把条件语句:

1
2
if  (data[j] >= 128)
sum += data[j];

变成:

1
2
int  t = (data[j] - 128) >> 31;
sum += ~t & data[j];

此处解释一下这段代码,这段代码适用于int类型的。因为int类型是32位的,int类型只有32位,右移31位剩下的就是符号位啦。所以第一行代码其实是取得符号位,现在我想大家可以看懂了吧。~t将符号位进行取反。然后进行&操作。而跟0与操作会得0,跟1与会等于本身。

“没有分叉”的性能基本上和“排好序有分支”一个样,无论是C/C++,还是Java。

注:在GCC下,如果你使用 -O3 or -ftree-vectorize 编译参数,GCC会帮你优化分叉语句为无分叉语句。VC++2010没有这个功能。

最后,推荐大家一个网站——Google Speed,网站上的有一些教程告诉你如何写出更快的Web程序

(全文完)

目录
相关文章
|
7月前
|
Linux 编译器 C++
C/C++性能优化:从根本上消除拷贝操作的浪费
C/C++性能优化:从根本上消除拷贝操作的浪费
881 1
|
2月前
|
监控 安全 算法
线程死循环确实是多线程编程中的一个常见问题,在编码阶段规避潜在风险
【10月更文挑战第12天】线程死循环确实是多线程编程中的一个常见问题,在编码阶段规避潜在风险
50 2
|
2月前
|
监控 安全 算法
线程死循环确实是多线程编程中的一个常见问题,它可能导致应用程序性能下降,甚至使整个系统变得不稳定。
线程死循环是多线程编程中常见的问题,可能导致性能下降或系统不稳定。通过代码审查、静态分析、日志监控、设置超时、使用锁机制、测试、选择线程安全的数据结构、限制线程数、使用现代并发库及培训,可有效预防和解决死循环问题。
62 1
|
2月前
|
存储 C#
【C#】大批量判断文件是否存在的两种方法效率对比
【C#】大批量判断文件是否存在的两种方法效率对比
42 1
|
4月前
|
Cloud Native 数据处理
项目环境测试问题之当异步任务在运行过程中抛出非预期的异常会导致后果如何解决
项目环境测试问题之当异步任务在运行过程中抛出非预期的异常会导致后果如何解决
|
7月前
|
监控 IDE 测试技术
预防和处理线程死循环的关键步骤
【5月更文挑战第24天】预防和处理线程死循环的关键步骤包括理解死循环成因(逻辑错误、竞争条件、资源泄漏)、编码阶段采取预防措施(明确退出条件、避免无限递归、正确使用锁、资源管理、健壮的错误处理)、调试定位(断点、日志、线程分析工具、性能分析)、解决问题(修改代码、临时解决方案、逐步排查)以及测试验证(充分测试、专用测试用例)。遵循这些步骤可有效管理线程死循环风险。
121 1
如何避免计算机计算出错?
如何避免计算机计算出错?
125 0
|
7月前
|
监控 安全
线程死循环是多线程应用程序开发过程中一个难以忽视的问题,它源于线程在执行过程中因逻辑错误或不可预见的竞争状态而陷入永久运行的状态,严重影响系统的稳定性和资源利用率。那么,如何精准定位并妥善处理线程死循环现象,并在编码阶段就规避潜在风险呢?谈谈你的看法~
避免线程死循环的关键策略包括使用同步机制(如锁和信号量)、减少共享可变状态、设置超时、利用监控工具、定期代码审查和测试、异常处理及设计简洁线程逻辑。通过这些方法,可降低竞态条件、死锁风险,提升程序稳定性和可靠性。
102 0
|
程序员
【编程】程序的局部性原理对代码效率的影响
【编程】程序的局部性原理对代码效率的影响
141 0