栈局部变量优化探究,意外发现了 vs 的一个 bug ?

简介: 栈局部变量优化探究,意外发现了 vs 的一个 bug ?

缘起

我在《栈又溢出了》 一文中记录了一个奇怪的栈溢出问题。虽然解决了,但是总感觉哪里不太合理。我想,vs 一定有一个合理的设置。一起折腾起来吧!

查找工程设置

本以为能找到某个编译选项对局部变量占用内存的行为进行控制。看遍了工程设置也没发现相关的设置项。release 版会不会有什么不同呢?毕竟,release 版会做一些优化,于是抱着试试看的心态编译了 release 版。您猜怎么着,居然没崩溃!

反汇编

赶紧查看下相关的反汇编,果然和预想的一样,函数局部变量占用的栈空间不再是 debug 版中的 0x12C0DC,而是 0x064008。换算成十进制大概是 409608

release-stack-usage.png

这说明三个局部变量被优化成了一个!release 优化果然给力!但是具体是哪一项优化导致的呢?该怎么排查呢?debug 版和 release 版结果不一样,最简单粗暴的方法就是找不同

对比设置

debug 版的配置保存到 debug.txtrelease 版的配置保存到 release.txt。然后用 beyond compare 比较两个文件的内容。

compare-debug-release-configuration.png

为了让各位小伙伴儿更清晰的对比 debugrelease 的区别,我特意调整了先后顺序,把不同的选项放到了后面!最重要的不同在最后一行。

debug 版为 /ZI /Gm /Od /RTC1 /MDdrelease 版为 /Zi /GL /Gy /Gm- /O2 /Oi /MD

不知道大家熟悉哪几个,我比较熟悉 /Od (禁用优化,debug 版的默认配置)和 /O2 (使速度最大化,release 版的默认配置)。

optimization-options.png

先把 /Od 改成 /O2 试试,没想到提示错误 error D8016: “/ZI”和“/O2”命令行选项不兼容。那就把 /ZI 改成 /Zi

说明:/Zi/ZI 都是用来配置生成调试符号的,与当前调查的问题基本没什么关系。使用 /ZI 生成的符号文件可以支持编辑并继续运行,低版本的 vs 对编辑并继续运行的功能支持的并不好,一般 /Zi 就好。
ZI-Zi-option.png

改好后,继续编译。没想到又遇到了如下错误:error D8016: “/O2”和“/RTC1”命令行选项不兼容。改成默认值,和 release 一样的设置。

filter-in-all-options.png

再次编译,这次终于编译通过了。再次运行 debug 版的程序,不报栈溢出了。赶紧查看反汇编确认,传给 _chkstk 的大小不再是之前的 0x12C0DC 了,而是 0x064004,转换成十进制是 409604

debug-stack-usage-with-o2.png

如果把 release 版的 /O2 改成 /Odrelease 版会不会也报栈溢出呢?

让 release 版也报栈溢出

说干就干,改好配置后编译,运行。果然,栈溢出了。

release-stackoverflow.png

至此,基本上找到了关键的编译选项—— /O2。但这就完了么?

/O2

google 中输入 /O2 msdn ,回车。第一条搜索结果就是 /O2 的官方文档。看看 /O2 都做了哪些优化。

msdn-o2.png

原来,/O2 相当于设置了这么多选项,到底是哪一个在起作用呢?一共才 7 个,不多,挨个试!恢复 debug 版的优化选项为 /Od。然后添加额外选项。先试 /Og

debug-compile-option-with-og.png

没想到运气这么好,一下就猜中了。这里就不放运行结果图了。

再查看下/Og 的官方文档。这里截取部分关键描述。

msdn-og.png

如何快速得到编译选项?

可以在工程上 右键,属性,配置属性,c/c++,命令行 来快速找到所有编译选项。如下图:
all-compile-options.png

vs2013 的 bug?

为了更好的理解栈局部变量优化策略,我准备了很多测试用例,其中有一个用例结果出乎意料!我把代码和结果贴出来。我想这应该是 vs2013 的一个 bug

#include "stdafx.h"

struct BigData
{
    char data[400 * 1024];
};

struct BigData1 : public BigData
{
    int data1;
};

struct BigData2 : public BigData1
{
    int data2;
    BigData1 bigData;
};

void Use(BigData* pData) { printf("%c", pData->data[0]); }
void CorrpuptStackEasyly(int argc)
{
    auto size = sizeof(BigData2);
    printf("size is %d", (int)size);

    if (argc == 1)
    {
        BigData data;
        Use(&data);
    }
    else if (argc == 2)
    {
        BigData1 data;
        Use(&data);
    }
    else
    {
        BigData2 data;
        Use(&data);
    }
}
int _tmain(int argc, _TCHAR* argv[])
{
    CorrpuptStackEasyly(argc);
    return 0;
}

BigData2 的大小应该是 819212,但是传递给 _chkstk 的值却是 1228824。看下图就知道我没瞎说。

strange_chkstk_value_in_vs2013.png

这真的是 vs2013bug 吗?同样的代码在高版本的 vs 中会是什么结果呢?vs2019 太大了,我的 c 盘已经爆红了,不想装了。偶然发现了一个超级宝藏网址,可以查看源代码被不同编译器编译后的汇编代码,真是宝藏啊。

宝藏网址

这个宝藏网址是 https://gcc.godbolt.org/。上面的代码的编译结果如下图:

higher-compiler-compile-result.png

符合预期!

总结

  • debugrelease 之所以不同,是因为设置了不同的选项。
  • 可以在所有选项下搜索对应的设置选项来快速定位某个设置。
  • /Og 可以消除不必要的局部变量,从而避免上文中的栈溢出问题。
相关文章
|
4天前
|
DataX
☀☀☀☀☀☀☀有关栈和队列应用的oj题讲解☼☼☼☼☼☼☼
### 简介 本文介绍了三种数据结构的实现方法:用两个队列实现栈、用两个栈实现队列以及设计循环队列。具体思路如下: 1. **用两个队列实现栈**: - 插入元素时,选择非空队列进行插入。 - 移除栈顶元素时,将非空队列中的元素依次转移到另一个队列,直到只剩下一个元素,然后弹出该元素。 - 判空条件为两个队列均为空。 2. **用两个栈实现队列**: - 插入元素时,选择非空栈进行插入。 - 移除队首元素时,将非空栈中的元素依次转移到另一个栈,再将这些元素重新放回原栈以保持顺序。 - 判空条件为两个栈均为空。
|
1月前
|
存储 C语言 C++
【C++数据结构——栈与队列】顺序栈的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现顺序栈的基本运算。开始你的任务吧,祝你成功!​ 相关知识 初始化栈 销毁栈 判断栈是否为空 进栈 出栈 取栈顶元素 1.初始化栈 概念:初始化栈是为栈的使用做准备,包括分配内存空间(如果是动态分配)和设置栈的初始状态。栈有顺序栈和链式栈两种常见形式。对于顺序栈,通常需要定义一个数组来存储栈元素,并设置一个变量来记录栈顶位置;对于链式栈,需要定义节点结构,包含数据域和指针域,同时初始化栈顶指针。 示例(顺序栈): 以下是一个简单的顺序栈初始化示例,假设用C语言实现,栈中存储
142 77
|
1月前
|
C++
【C++数据结构——栈和队列】括号配对(头歌实践教学平台习题)【合集】
【数据结构——栈和队列】括号配对(头歌实践教学平台习题)【合集】(1)遇到左括号:进栈Push()(2)遇到右括号:若栈顶元素为左括号,则出栈Pop();否则返回false。(3)当遍历表达式结束,且栈为空时,则返回true,否则返回false。本关任务:编写一个程序利用栈判断左、右圆括号是否配对。为了完成本关任务,你需要掌握:栈对括号的处理。(1)遇到左括号:进栈Push()开始你的任务吧,祝你成功!测试输入:(()))
38 7
|
1月前
|
存储 C++ 索引
【C++数据结构——栈与队列】环形队列的基本运算(头歌实践教学平台习题)【合集】
【数据结构——栈与队列】环形队列的基本运算(头歌实践教学平台习题)【合集】初始化队列、销毁队列、判断队列是否为空、进队列、出队列等。本关任务:编写一个程序实现环形队列的基本运算。(6)出队列序列:yzopq2*(5)依次进队列元素:opq2*(6)出队列序列:bcdef。(2)依次进队列元素:abc。(5)依次进队列元素:def。(2)依次进队列元素:xyz。开始你的任务吧,祝你成功!(4)出队一个元素a。(4)出队一个元素x。
44 13
【C++数据结构——栈与队列】环形队列的基本运算(头歌实践教学平台习题)【合集】
|
1月前
|
存储 C语言 C++
【C++数据结构——栈与队列】链栈的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现链栈的基本运算。开始你的任务吧,祝你成功!​ 相关知识 初始化栈 销毁栈 判断栈是否为空 进栈 出栈 取栈顶元素 初始化栈 概念:初始化栈是为栈的使用做准备,包括分配内存空间(如果是动态分配)和设置栈的初始状态。栈有顺序栈和链式栈两种常见形式。对于顺序栈,通常需要定义一个数组来存储栈元素,并设置一个变量来记录栈顶位置;对于链式栈,需要定义节点结构,包含数据域和指针域,同时初始化栈顶指针。 示例(顺序栈): 以下是一个简单的顺序栈初始化示例,假设用C语言实现,栈中存储整数,最大
46 9
|
3月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
99 1
|
3月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
3月前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
99 5
|
3月前
|
算法
数据结构之购物车系统(链表和栈)
本文介绍了基于链表和栈的购物车系统的设计与实现。该系统通过命令行界面提供商品管理、购物车查看、结算等功能,支持用户便捷地管理购物清单。核心代码定义了商品、购物车商品节点和购物车的数据结构,并实现了添加、删除商品、查看购物车内容及结算等操作。算法分析显示,系统在处理小规模购物车时表现良好,但在大规模购物车操作下可能存在性能瓶颈。
72 0
|
3月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
55 1

热门文章

最新文章

相关实验场景

更多