C陷阱:数组越界遍历,不报错却出现死循环?从内存解析角度看数组与局部变量之“爱恨纠葛”

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 在代码练习中,通常会避免数组越界访问,但如果运行了这样的代码,可能会导致未定义行为,例如死循环。当循环遍历数组时,如果下标超出数组长度,程序可能会持续停留在循环体内。这种情况的发生与数组和局部变量(如循环变量)在内存中的布局有关。在某些编译器和环境下,数组和局部变量可能在栈上相邻存储,数组越界访问可能会修改到循环变量的值,导致循环条件始终满足,从而形成死循环。理解这种情况有助于我们更好地理解和预防这类编程错误。

在平时的代码练习中,数组越界访问当然是会被规避的。然而,如果运行了令数组越界访问的代码,会产生什么后果?如果我们从未了解过,可能会下意识地认为,编译器会报错、阻止程序运行,或直接挂掉程序。


事实上还有一种较为常见的结果:死循环。循环遍历数组时,如果遍历的数组下标超出数组长度,程序无休止地卡在了循环体内。这和栈中数组与循环变量(局部变量)创建的位置紧密相关。


本文从创建数组和局部变量的内存解析角度,对上述情况加以说明。学习C语言的我们也应当对这类情况有所了解并能清晰解释。


本文先用调试和画图的方式解析死循环出现的原因,文末附上了完整的文字解释,可供大家参考。


注: 本文实验采用的编译器为 RedPanda DevC++,在较新版本的编译器(如VS 2022)下测试结果可能会有差异,因为新的编译器会对代码进行优化。以下是本文的主要内容。


我们来看下面这组代码:


#include <stdio.h>
int main()
{
    int i = 0;
    int arr[] = {1,2,3,4,5,6,7,8,9,10};    //数组长度为10
    for(i=0; i<=12; i++)    //循环变量从0到12,出现了越界情况
    {
        arr[i] = 0;    //将数组内的每个元素置0
        printf("hello\n");    //并打印hello
    }
    return 0;
}


上述程序代码中,数组长度为10,然而下标却取到了11、12,数组的下标越界。


当程序运行后,出现了如下情况:



死循环地打印hello


注意:编译器并未对下标越界的情况报错,程序可以正常启动,但在程序中出现了bug。光以肉眼看,我们无法排查出问题。


我们通过调试来进一步观察。



05行的小警告是提示我arr数组set but not used,与该情况无关~

 

一、调试


1. 启动调试,我们在左侧添加一些监视,包括循环变量i与arr[9](最后一个数组元素)到arr[12]之间的值。 此时理论上来说,arr[10]、arr[11]、arr[12]三个数由于不是我们的数组元素,没有被初始化,里面装的是随机值。



2. 单步调试。


在第二次结束循环体后可以看到,i 的值为2,数组的前两个元素arr[0]与arr[1]也如期被我们改成了0.控制台也打印了两个"hello",此时程序的运行一切正常。




3. 经过观察我们发现,当 i 从0到9时(也就是在数组界内时),程序的运行都是正常的:每次循环都有一个数组元素被置0,并且打印一个"hello"。我们让i快速来到9,这时我们观察在这之后程序内各变量值的变化。




4. 我们让 i 来到10,这时有:数组arr[10],要操作arr[10] = 0;注意,这里也并不会有任何报错提示。因为数组名本质上是一个地址,arr[10]即*(arr+10),尽管此时的空间并不是我们数组内的合法空间,但依旧能够访问并更改其值。


如下图,arr[10]也确实被改成了0.


内存中不属于数组元素的值竟然也能被直接更改,可见野指针/数组越界访问确实是存在非常大的风险的。)




这时重点来了!


我们再向下走,当arr[11]也被改成0时,i竟然也被改成了0!!




很难让人不怀疑:有没有可能,arr[11]和i共用的是同一个空间?换句话说,arr[11]就是i?


通过取地址来求证,我们发现,arr[11]与i的地址相同,从而印证了我们上面的猜想:arr[11]实际上就是i



事实上如果一开始就在监视窗口中添加了arr[11],可以很清晰地发现,随着每次循环i的值发生变化,arr[11]的值也一直在变化:



1. i等于0时,arr[11]也是0



2. i等于5时,arr[11]也是5


确实,arr[11]与i是同步变化的,arr[11]就是i,它们共用同一块内存单元,它们实质上代表同一个变量。


因此,每当 i 到达11时候,arr[11]就会被置为0,而arr[11]就是i ,相当于 i 被置为0.于是, i 在0到11之间反复横跳,永远也无法跳出这个范围。同样,arr[12]永远也无法遍历到,循环无法自行结束,这样一来便出现了死循环的现象。


下面我们画内存解析图,分析底层原理。


二、内存解析图解


首先我们需要知道:


1. 数组随着下标的增长地址是由低到高变化的。

2. i 和 arr 是局部变量,局部变量是放在栈区的。

3. 栈区内存的使用习惯:先使用高地址的空间,再使用低地址的空间。


上述代码中,创建局部变量i和数组的代码顺序是这样的:


int i = 0;    //先创建局部变量 i
int arr[] = {1,2,3,4,5,6,7,8,9,10};    //再创建数组arr


由栈区内存的使用习惯知,变量 i 的地址要高于arr数组。因此,内存中各个变量的创建位置如下图所示:



内存解析图,一个格子代表一个int型


绿色部分为数组元素,连续的10个空间;蓝色部分为arr[11],即 i 。


当遍历数组元素时,自低地址向高地址走,而 i 又恰好“等”在高地址的某处。数组不越界则已,一越界就很有可能碰上在“高”处等候的变量 i 。此时无意间操作了循环变量 i ,就极有可能造成循环失控,而死循环正是循环失控的一种。



数组自低地址向高地址遍历元素,越界后可能碰到高地址的 i


同样,这种循环失控并不是百分百的。就拿本题来说,若把 i 的边界控制成为 i <10,令 i 到不了11,那么程序依旧可以正常运行,不会报错或失控。



那么变量 i 的空间与数组末元素的空间相隔多少个空间呢? 这完全取决于编译器如何实现。经过不完全测验,一些编译器及其空间分配关系如下:


1. VC 6.0                中间没有多余空间。


2. gcc                中间空1个整型。


3. vs2013/2019                中间空2个整型。


4. DevC++                中间空1个整型。


5. vs2022                功能优化,在运行时会直接报错,不会出现如上问题。


*可能有误,具体实现以编译器实际情况为准。



博主本人在vs2022测试时发现的情况


release模式下,代码会自动优化,规避掉可能存在的隐患。因此在release模式下运行,也不会出现循环失控。



release模式下检查i与arr元素的地址高低关系,发现虽然i先声明创建但i的地址却低于arr[0]

这是编译器自动调整的结果


如果调换代码书写的位置,又会如何呢?


int arr[] = {1,2,3,4,5,6,7,8,9,10};
int i = 0;


这时,由于变量创建的顺序发生了变化,而内存的使用习惯仍然是先使用高地址,再使用低地址,此时我们的变量 i 在内存中的地址在数组arr的更低地址处,此时不会发生循环失控。



如图,此时即使循环越界,i 与arr[i]也不会相遇


需要注意的是,虽然这样不会发生循环失控,但仍然可能会有新的问题。毕竟数组发生越界,且强行更改了不属于数组元素空间内的值,编译器可能会弹窗报错(类似上面vs2022的处理情况)。


之所以原来的代码书写位置不会让编译器报错,是因为程序卡在了死循环,没有报错的机会。而当不出现死循环时,编译器就有可能发现异常,弹窗报错。(具体看编译器的处理。)


三、总结:原因解释


面试题



解释


变量i与数组a在栈上开辟空间,而我们知道,栈区的使用习惯是先使用高地址再使用低地址,因此i在高地址的位置,arr数组在低地址的位置。同时,随着数组下标的增长,地址是由低到高变化的。数组适当往后越界,就有可能覆盖到 i ,将循环变量 i 改变,从而导致循环的判断条件恒为真,最终造成程序循环失控。(结合示意图说明更清晰。)






相关文章
|
26天前
|
存储 缓存 安全
Java内存模型深度解析:从理论到实践####
【10月更文挑战第21天】 本文深入探讨了Java内存模型(JMM)的核心概念与底层机制,通过剖析其设计原理、内存可见性问题及其解决方案,结合具体代码示例,帮助读者构建对JMM的全面理解。不同于传统的摘要概述,我们将直接以故事化手法引入,让读者在轻松的情境中领略JMM的精髓。 ####
33 6
|
1月前
|
存储 Java 编译器
Java内存模型(JMM)深度解析####
本文深入探讨了Java内存模型(JMM)的工作原理,旨在帮助开发者理解多线程环境下并发编程的挑战与解决方案。通过剖析JVM如何管理线程间的数据可见性、原子性和有序性问题,本文将揭示synchronized关键字背后的机制,并介绍volatile关键字和final关键字在保证变量同步与不可变性方面的作用。同时,文章还将讨论现代Java并发工具类如java.util.concurrent包中的核心组件,以及它们如何简化高效并发程序的设计。无论你是初学者还是有经验的开发者,本文都将为你提供宝贵的见解,助你在Java并发编程领域更进一步。 ####
|
19天前
|
存储 算法 Java
Java内存管理深度解析####
本文深入探讨了Java虚拟机(JVM)中的内存分配与垃圾回收机制,揭示了其高效管理内存的奥秘。文章首先概述了JVM内存模型,随后详细阐述了堆、栈、方法区等关键区域的作用及管理策略。在垃圾回收部分,重点介绍了标记-清除、复制算法、标记-整理等多种回收算法的工作原理及其适用场景,并通过实际案例分析了不同GC策略对应用性能的影响。对于开发者而言,理解这些原理有助于编写出更加高效、稳定的Java应用程序。 ####
|
27天前
|
存储 C语言 计算机视觉
在C语言中指针数组和数组指针在动态内存分配中的应用
在C语言中,指针数组和数组指针均可用于动态内存分配。指针数组是数组的每个元素都是指针,可用于指向多个动态分配的内存块;数组指针则指向一个数组,可动态分配和管理大型数据结构。两者结合使用,灵活高效地管理内存。
|
27天前
|
容器
在使用指针数组进行动态内存分配时,如何避免内存泄漏
在使用指针数组进行动态内存分配时,避免内存泄漏的关键在于确保每个分配的内存块都能被正确释放。具体做法包括:1. 分配后立即检查是否成功;2. 使用完成后及时释放内存;3. 避免重复释放同一内存地址;4. 尽量使用智能指针或容器类管理内存。
|
2月前
|
存储 安全 程序员
内存越界写入
【10月更文挑战第13天】
52 4
|
2月前
|
Rust 安全 Java
内存数组越界
【10月更文挑战第14天】
34 1
|
2月前
|
Java 编译器 C++
内存越界读取
【10月更文挑战第13天】
53 2
|
2月前
|
存储 容器
内存越界访问(Out-of-Bounds Access)
【10月更文挑战第12天】
253 2
|
2月前
|
人工智能 前端开发 JavaScript
拿下奇怪的前端报错(一):报错信息是一个看不懂的数字数组Buffer(475) [Uint8Array],让AI大模型帮忙解析
本文介绍了前端开发中遇到的奇怪报错问题,特别是当错误信息不明确时的处理方法。作者分享了自己通过还原代码、试错等方式解决问题的经验,并以一个Vue3+TypeScript项目的构建失败为例,详细解析了如何从错误信息中定位问题,最终通过解读错误信息中的ASCII码找到了具体的错误文件。文章强调了基础知识的重要性,并鼓励读者遇到类似问题时不要慌张,耐心分析。

推荐镜像

更多