【趣话编程】进入编译器后,一个函数经历了什么?

简介: 一个函数的冒险之旅。

1.jpg

原文链接

我是一个函数

我是一个函数,名叫str_upper,我可以把输入的字符串从小写变成大写。不信你看,我长这样:

char* str_upper(char* str, int len) {
  
  char upper[256];
  
  if (len >= 256 || len <= 0) 
    return nullptr;
  for (int i = 0; i < len; i++) {
    if (str[i] >= 'a' && str[i] <= 'z') {
      upper[i] = str[i] - 32;
    } else {
      upper[i] = str[i];
    }
  }
  
  return upper;
}

上面是我的源代码形式,听我的好朋友str_lower说,一会儿我们就要一起被送到一个叫编译器的地方加工处理了,我心里害怕极了。

编译器之旅

没多久,我们就来到了这里,一座很庞大到高楼,里面有好多精密的机器在不停的运转着。
一进入大厅,好多函数代码在这里排队等待。
我抬头向上望去,不知道有多少层楼,每一层都有一个指示牌,从下往上分别写着:

  • 预处理
  • 词法分析
  • 语法分析
  • 语义分析
  • ···

再往上太远就看不太清楚了。
所有的函数代码按照文件为单位排好队,静静地等待着。
不过没有等太久,就轮到了我们这一队。
来了一个工作人员把我们带到了一个房间,让我们都好好躺着,一台机器快速的从头到尾扫描了一遍,将我们所在文件中出现的#include#define全部给替换掉了。
接着,通过房间里的电梯,将我们送上了二楼。
接下来的一段时间,我们在好几层楼都做了“体检”,每个函数都被那些像CT一样的机器照了个遍。
不一会儿,来到了编译层,这一层有一个特别奇怪的机器,我看到一个个函数被送了进去,出来的时候都变了样子。不仅如此,接待处的工作人员看起来很凶,我这下更加紧张了。

函数调用约定

工作人员拿到了我的资料,瞅了几眼,问到:“请问你的调用约定是什么?”
我有些懵,不太懂他的意思,小声问到:“不好意思,你刚问什么?”
工作人员有点不耐烦了,提高了音量,“我是问你调用约定是什么?调用约定啊!”
看见我仍然一脸茫然,工作人员直接给我的资料上调用约定那一栏盖上了一个标记:cdecl
我有点摸不着头脑,同行的小伙伴str_lower拽了我一下说到:“他是在问你函数的调用约定,就是约定调用函数的方式,涉及怎么传递参数,谁来恢复调用栈等”
他这一说我才反映过来,“这个调用约定都有哪些可选的呢?”
“一般有三种:”

  • cdcel,参数从右往左入栈,主调函数负责恢复栈平衡
  • stdcall,参数从右往左入栈,被调函数负责恢复栈平衡
  • fastcall,参数通过寄存器传递,寄存器不够再用栈传递

“他刚才看你没有显式声明,就默认给你cdecl的方式了”,小伙伴继续说到。
我点了点头,原来调用个函数还有这么多讲究呐!

Stack Canary

“别闲聊了,快进去吧!”,工作人员催我了。
我准备走向那台可怕的机器。
“唉,等一下”,正紧张着,工作人员又叫住了我。
我回头看去,工作人员正招手让我过去。
“你好,是我的代码有什么问题吗?”,我紧张的问到,生怕有错误被打回去,连累我们整个文件都要被遣返。
“不是,是我注意到你的函数里有一个局部数组,需要给你加一下栈溢出保护”,工作人员说到。
我看了下我的代码,确实有一个局部字符数组:

char upper[256];

“栈溢出保护是什么啊?”,我小声问到。
工作人员没有搭理我,忙着给我的资料上加东西。
旁边的小伙伴又把我拽了过去,说到:“咱们函数里面定义的局部变量、参数是存放在线程栈里面的。线程要不断游走在不同的函数中,调用函数后为了能回到原来的地方,调用之前把返回地址也放在了线程栈里。就像这样,你看会不会有什么问题:”
image.png
我仔细看了下,“哦,要是越界访问我的upper数组,那就可以修改返回地址,那可就危险了!”
“很聪明嘛!”
“那这个怎么加保护呢?”,我问到。
“你看,函数进来之前,先在局部变量和返回地址之间设置一个数值,函数返回之前再去检查一下,如果栈里的数据被破坏了,检查这个数值就能发现,提前抛出异常!”,小伙伴耐心的解释到。
“这样啊,那岂不是要把我打回去加上你说的这些设置和检查代码?”,我继续提问。
这时,工作人员听到了我们的闲聊,“不用,我们编译器自动添加好了,快去吧,已经处理好了”
我瞥了一眼,看到我的资料上增加了一个叫Stack Canary的标记。
我小心翼翼的走进了那架奇怪的机器,立刻就失去了知觉,等我醒来时,我的身体已经发生了变化,变成了一堆奇怪的代码,现在我长这样了:
image.png

链接

没过一会儿,我们这一队的所有函数代码都编译完成,大家从原来的.c文件都搬到了新家:一个.o文件,我也再次见到了小伙伴str_lower。
“咱们是不是已经完成了编译,可以离开这里了吧?”
“还不行,编译虽然是完成了,还差链接这一步呢!”
又过了一小会儿,和我们一起过来的其他文件的函数代码也编译完成了,咱们一堆.o文件一起被送到了编译器大厦的顶楼:链接层。
这一层也有一个巨大的机器,机器背后连接了一个管道,不知通向了哪里。
我们这一批的所有.o文件挨个走进了这个巨大的机器,像是一条时空隧道一般,穿行于其间,我感觉到了巨大的压力把我们挤压在了一起,很快我们再一次失去了意识。
醒来之后,我发现所有的函数们都被合在了一个文件中,这是一个可执行文件,而我的身体也再次发生了变化,变成了一段段的二进制指令,现在我长这样了:
image.png

终于离开了编译器,真是一趟难忘的旅程,不过我再也不想来了······

彩蛋

没想到命运跟我开了一个玩笑,我的第一次运行就出了错!
我又要被打回去重新改造,再走一遍这魔鬼般的旅程。
你能帮我看看,我的代码哪里有错吗?

作者 | 轩辕之风O
来源 | 编程技术宇宙

相关文章
|
Ubuntu Windows
Qt开发笔记之编码h264码流并封装mp4(六):ubuntu平台编译mp4v2并封装mp4
Qt开发笔记之编码h264码流并封装mp4(六):ubuntu平台编译mp4v2并封装mp4
Qt开发笔记之编码h264码流并封装mp4(六):ubuntu平台编译mp4v2并封装mp4
|
安全 Java Linux
|
11月前
|
算法 计算机视觉
Opencv学习笔记(六):cv2.resize函数的介绍
这篇文章介绍了OpenCV库中cv2.resize函数的使用方法,包括其参数、插值方式选择以及实际代码示例。
1520 1
Opencv学习笔记(六):cv2.resize函数的介绍
软件著作书 60页代码轻松搞定!(附exe和代码)
软件著作书 60页代码轻松搞定!(附exe和代码)
|
11月前
|
设计模式 存储 C#
C# 一分钟浅谈:命令模式与职责链模式
【10月更文挑战第16天】本文介绍了命令模式和职责链模式两种行为设计模式。命令模式将请求封装成对象,支持可撤销操作;职责链模式将请求沿处理者链传递,支持动态添加或删除处理者。文章通过C#代码示例详细解释了这两种模式的核心组件、优点、缺点及常见问题,并提供了如何避免这些问题的建议。
104 5
|
11月前
|
JavaScript API
vue3知识点:自定义hook函数
vue3知识点:自定义hook函数
106 2
|
11月前
|
运维 关系型数据库 持续交付
深入理解后端开发中的微服务架构
【10月更文挑战第7天】 在当今快速变化的技术世界中,后端开发正经历着前所未有的变革。其中,微服务架构作为一种新兴的设计理念,正在逐渐改变我们构建、部署和运维大型软件系统的方式。本文将从微服务的起源讲起,探讨其核心概念、技术栈以及实际应用场景,帮助读者深入理解微服务架构的魅力与挑战。
143 0
|
前端开发 关系型数据库 MySQL
最新黑名单查询录入系统PHP网站源码
最新黑名单查询录入系统PHP网站源码 前端html 后端layui 操作部分都采用API接口的方式实线 集结了layui表格的多数据操作,添加,批量删除,分页,单项删除 后台数据修改采用绑定参数的形式来进行修改可以很好的预防数据库注入,当然如果你想要测试这个防注入的你也可以尝试一下 PHP版本70+ 数据库Mysql 5.6 上传程序访问 http://你的域名/install 安装
361 0
|
SQL Java 数据库
Sqoop【付诸实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)
【2月更文挑战第10天】Sqoop【付诸实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)
511 0