[Eigen中文文档] 编译器对堆栈对齐做出了错误的假设

简介: 本文将介绍编译器对堆栈对齐做出了错误的假设问题。

文档总目录

英文原文(Compiler making a wrong assumption on stack alignment)

这是 GCC 的错误,已在 GCC 4.5 中修复。如果遇到此问题,请升级到 GCC 4.5

到目前为止,我们只在 Windows 上遇到过 GCC:例如,MinGW 和 TDM-GCC。

默认情况下,在类似如下函数中:

void foo()
{
   
  Eigen::Quaternionf q;
  //...
}

GCC 假定堆栈已经是 16 字节对齐的,因此对象 q 将在 16 字节对齐的位置创建。根据 Eigen 的要求,不需要特别注意显式对齐对象 q

问题是,在某些特定情况下,这种假设在 Windows 上可能是错误的,其中堆栈只保证 4 字节对齐。 实际上,即使 GCC 负责对齐 main 函数中的堆栈并尽最大努力保持其对齐,但当从另一个线程或从使用另一个编译器编译的二进制文件调用函数时,堆栈对齐可能会被破坏。这会导致在未对齐的位置创建对象 q,从而使程序因对未对齐数组断言而崩溃。至此我们找到了以下解决方案。

局部解决方案

局部解决方案是使用此属性标记此类功能:

__attribute__((force_align_arg_pointer)) void foo()
{
   
  Eigen::Quaternionf q;
  //...
}

阅读 GCC 文档 以了解其作用。当然,这只能在 Windows 上的 GCC 上完成,因此为了可移植性,必须将其封装在一个宏中,并在其他平台上设置该宏为空。此解决方案的优点是可以精确地选择哪个函数可能具有损坏的堆栈对齐。当然,不利的一面是必须为每个此类功能完成此操作,因此可能更喜欢以下两种全局解决方案之一。

全局解决方案

一个全局解决方案是在 Windows 上使用 GCC 进行编译时,使用如下选项:

-mincoming-stack-boundary=2

这告诉 GCC 堆栈只需要对齐到 2^2=4 字节,因此 GCC 现在知道它确实必须格外小心,以便在需要时遵守固定大小的可向量化 Eigen 类型的 16 字节对齐。

另一个全局解决方案是使用如下选项:

-mstackrealign

这与将 force_align_arg_pointer 属性添加到所有函数具有相同的效果。

这些全局解决方案易于使用,但请注意它们可能会损耗程序效率,因为它们会导致每个函数都有额外的序言/结尾说明。

相关文章
|
存储 编译器 C语言
[Eigen中文文档] 对未对齐数组断言的解释
本文将解释程序因断言失败而终止的问题。
213 0
|
C语言
C语言指针理解---写代码测试堆栈的生长方向
C语言指针理解---写代码测试堆栈的生长方向
92 1
|
8月前
|
编译器 C++
《Effective C++ 改善程序与设计的55个具体做法》 第二章 构造/析构/赋值运算 笔记
《Effective C++ 改善程序与设计的55个具体做法》 第二章 构造/析构/赋值运算 笔记
|
编译器 C语言 C++
初始C语言——梦开始的地方
C语言是一门通用计算机编程语言,广泛应用于底层开发。作为长期位于各大编程语言排行榜前三的高级语言,C语言具有广泛性、简洁性、结构完善性等特有特点,作为B语言的改进版本,C语言也能直接通过内存地址进行内存操作,这是大多数高级语言所不具备的特点,而我们的C可以。因此C语言具有极为强大的功能和较为直接的底层逻辑,换句话说,只要把C学好了,就能掌握编程的核心技术,其他高级语言的学习如探囊取物。
202 0
初始C语言——梦开始的地方
|
C语言
初始c语言的常见错误和盲区
第一个先来后置++,大体使用上我认为后置++的频率比前置要高 **后置++ 先执行表达式 等表达式执行完后 再+**+ 也就是**先使用 后++** 这里面**b=a++ 可以拆分成 b=a a=a+1** 而来到c的时候 a的值已经加1了 即c=11
117 0
初始c语言的常见错误和盲区

热门文章

最新文章