前文
纸上得来终觉浅,希望通过直观的代码测试出来内核切换的开销
测试过程
通过两段程序进行对比,第一段是进行了系统调用获取uid,第二段是直接返回一个uid的值
gcc callsystem.c -o callsystem gcc calluser.c -o calluser
测试结果
我们可以看到带有系统调用耗时需要11秒左右,用户态的耗时0.15s,开销上的差异非常明显
系统调用的代码
#include<unistd.h> #define MAX 50000000 int main(){ int ii; for(ii = 0;ii < MAX; ii++) getuid(); return 0; }
非系统调用的代码
#include<unistd.h> #define MAX 50000000 int _getuid(){ return 1001; } int main(){ int ii; for(ii = 0;ii < MAX; ii++) _getuid(); return 0; }
strace 跟踪系统调用
其实getuid不管系统还是用户,都是返回数字就是,测试下来可以看出差异那么大
我们使用strace跟踪一下调用
strace -c ./callsystem
下面这个uid其实已经跑不出来了,基本也就是在系统调用的时候耗时
系统调用慢的缘由
系统调用其实就是应用程序和内核空间的一票接口,因为服务是在内核中提供的,所以不能直接调用调用流程如下:
实际上,系统调用的过程首先需要把用户态切换成内核态,系统调用过程是通过软中断0x80实现的,这个是比较核心的因素,因为一旦是涉及到其他中断就需要经历和其他中断一样的过程,当年这块可是考试重点:
关键的结论其实就是,宏观上来说CPU利用率是提高了,但是实际上来说中断的工作以及处理恢复工作其实都是非常耗时的,系统调用慢的缘由便是如此!