深入理解指针
上期回顾:【C语言基础】:深入理解指针(一)
一、指针运算
指针的基本运算有三种,分别是:
1. 指针 ± 整数
2. 指针 - 指针
3. 指针的关系运算
1. 指针 ± 整数
在C语言中,我们知道数组在内存中是连续存放的,所以我们只要知道了数组第一个元素的地址,就可以顺藤摸瓜找到后面元素的地址。
int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
#include<stdio.h> // 指针 +- 整数 int main() { int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; int* p = &arr[0]; int sz = sizeof(arr) / sizeof(arr[0]); // 计算元素个数 int i = 0; for (i = 0; i < sz; i++) { printf("%d ", *(p + i)); // 指针 +- 整数 } return 0; }
上述示例中,通过 *(p + i) 的方式可以实现指针向前移动 i 个位置,并访问对应位置的数组元素。
2. 指针 - 指针
在C语言中,不止整数之间可以进行运算,其实指针与指针之间也可以进行运算,指针与指针之间可以进行减法运算,两个指针相减得到的是一个整数,表示它们之间相隔元素的个数。
#include<stdio.h> // 指针 - 指针 // 模拟strlen库函数 my_strlen(char *s) { char* p = s; while (*p != '\0') p++; return p - s; } int main() { printf("%d\n", my_strlen("abc")); return 0; }
3. 指针的关系运算
#include<stdio.h> int main() { int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; int* p = &arr[0]; int sz = sizeof(arr) / sizeof(arr[0]); // 计算数组之间的元素个数 int i = 0; while (p < arr + sz) // 指针的大小比较 { printf("%d ", *p); p++; } return 0; }
在上述示例中,通过指针 p 和数组大小 sz 的比较,保证了在不越界的情况下遍历整个数组。
二、野指针
野指针就是指指针指向的位置是不可知的(随机的、不正确的、没有明确限制的)
1. 野指针成因
指针未初始化
局部变量未初始化,默认随机值
int main() { int* p; // 局部变量未初始化,默认随机值 *p = 30; return 0; }
指针越界访问
int main() { int arr[10] = { 0 }; int* p = &arr[0]; int i = 0; for (i = 0; i <= 11; i++) { // 当指针指向的范围超出数组arr的范围时,p就是野指针 *(p++) = i; } return 0; }
可以看到,调试运行之后程序直接就抛出异常了,所以为了安全最好要避免野指针的出现。
指针指向的空间释放
int* test() { int n = 100; return &n; } int main() { int* p = test(); printf("%d\n", *p); return 0; }
在函数 test() 中,指针返回指向的是一个局部变量 n 的地址,在函数执行完毕后,n 的内存空间会被释放掉,导致返回的指针指向的内存区域已经无效。
2. 如何避免野指针
指针初始化
如果明确知道指针指向哪里就直接赋值地址,如果不知道指针应该指向哪里,可以给指针赋值NULL,
NULL 是C语言中定义的一个标识符常量,值是0,0也是地址,这个地址是无法使用的,读写该地址会报错。
int main() { int num = 10; int* p1 = # int* p2 = NULL; *p1 = 20; // *p2 = 20; // err printf("%d\n", *p1); // printf("%d\n", *p2); return 0; }
可以看到,若是我们直接去访问0这个地址,程序会直接给我们报错。
小心指针越界
一个程序向内存申请了哪些空间,通过指针也就只能访问哪些空间,不能超出范围访问,超出了就是越界访问。
int main() { int arr[10] = { 0 }; int* p = &arr[0]; int i = 0; for (i = 0; i < 10; i++) { *(p++) = i; } return 0; }
指针变量不再使用时,及时置NULL,指针使用之前检查有效性
当指针变量指向⼀块区域的时候,我们可以通过指针访问该区域,后期不再使用这个指针访问空间的
时候,我们可以把该指针置为NULL。因为约定俗成的⼀个规则就是:只要是NULL指针就不去访问,
同时使用指针之前可以判断指针是否为NULL。
int main() { int arr[10] = {1,2,3,4,5,67,7,8,9,10}; int *p = &arr[0]; for(i=0; i<10; i++) { *(p++) = i; } //此时p已经越界了,可以把p置为NULL p = NULL; //下次使⽤的时候,判断p不为NULL的时候再使⽤ //... p = &arr[0];//重新让p获得地址 if(p != NULL) //判断 { //... } return 0; }
避免返回局部变量的地址
三、assert断言
assert.h 头文件定义了宏 assert() ,⽤于在运行时确保程序符合指定条件,如果不符合,就报
错终止运行。这个宏常常被称为“断言”。
assret(p != NULL)
上面代码在程序运行到这一行语句时,验证变量 p 是否等于 NULL 。如果确实不等于 NULL ,程序
继续运行,否则就会终止运行,并且给出报错信息提示。
assert() 宏接受⼀个表达式作为参数。如果该表达式为真(返回值非零), assert() 不会产生
任何作用,程序继续运行。如果该表达式为假(返回值为零), assert() 就会报错,在标准错误
流 stderr 中写入一条错误信息,显示没有通过的表达式,以及包含这个表达式的⽂件名和行号。
assert() 的使用对程序员是非常友好的,使用 assert() 有几个好处:它不仅能自动标识文件和
出问题的行号,还有⼀种无需更改代码就能开启或关闭 assert() 的机制。如果已经确认程序没有问
题,不需要再做断言,就在 #include <assert.h> 语句的前⾯,定义⼀个宏 NDEBUG 。
#define NDEBUG #include<assert.h>
然后,重新编译程序,编译器就会禁用文件中所有的 assert() 语句。如果程序又出现问题,可以移
除这条 #define NDEBUG 指令(或者把它注释掉),再次编译,这样就重新启用了 assert() 语
句。
assert() 的缺点:因为引入了额外的检查,增加了程序的运行时间。
⼀般我们可以在 Debug 中使用,在 Release 版本中选择禁用 assert 就行,在 VS 这样的集成开
发环境中,在 Release 版本中,直接就是优化掉了。这样在debug版本写有利于程序员排查问题,
在 Release 版本不影响用户使用时程序的效率。
四、指针的使用和传址调用
4.1 strlen的模拟实现
库函数strlen的功能是求字符串长度,统计的是字符串中 \0 之前的字符的个数。
函数原型如下:
size_t strlen ( const char * str );
参数str接收⼀个字符串的起始地址,然后开始统计字符串中 \0 之前的字符个数,最终返回⻓度。
如果要模拟实现只要从起始地址开始向后逐个字符的遍历,只要不是 \0 字符,计数器就+1,这样直
到 \0 就停止。
#include<stdio.h> #include<assert.h> int my_strlen(const char* str) { int count = 0; assert(str); while (*str) { count++; str++; } return count; } int main() { int len = my_strlen("abcdef"); printf("%d\n", len); return 0; }
4.2 传值调用和传址调用
【示例】:写⼀个函数,交换两个整型变量的值
错误示范
#include<stdio.h> void Swap1(int x, int y) { int tmp = 0; tmp = x; x = y; y = tmp; } int main() { int a = 0; int b = 0; scanf("%d %d", &a, &b); prinf("交换前:%d %d\n", a, b); Swap1(a, b); printf("交换后:%d %d\n", a, b); return 0; }
可以发现,代码运行后未发生交换,这是为什么呢?
经过调试后我们发现,main函数内部创建的a和b确实传到了Swap函数里的x和y中,但我们查看a和b的地址与Swap函数里的x和y的地址进行对比时,我们就可以发现问题了,它们的地址不一样,这就相当于Swap函数里的x和y是一个独立的空间,在Swap函数内部进行了交换,但却无法返回到main函数中,导致a和b没有实现交换,Swap1函数在使用的时候,是把变量本身直接传递给了函数,这种调用函数的方式我们之前在函数的时候就知道了,这种叫传值调用。
结论:实参传递给形参的时候,形参会单独创建⼀份临时空间来接收实参,对形参的修改不影响实参。
解决办法:我们现在要解决的就是当调用Swap函数的时候,Swap函数内部操作的就是main函数中的a和b,直接 将a和b的值交换了。那么就可以使用指针了,在main函数中将a和b的地址传递给Swap函数,Swap函数里边通过地址间接的操作main函数中的a和b,并达到交换的效果就好了。
#include<stdio.h> void Swap2(int* px, int* py) { int tmp = 0; tmp = *px; *px = *py; *py = tmp; } int main() { int a = 0; int b = 0; scanf("%d %d", &a, &b); printf("交换前:%d %d\n", a, b); Swap2(&a, &b); printf("交换后:%d %d\n", a, b); return 0; }
我们可以看到实现成Swap2的方式,顺利完成了任务,这⾥调用Swap2函数的时候是将变量的地址传
递给了函数,这种函数调用方式叫:传址调用。
传址调用,可以让函数和主调函数之间建立真正的联系,在函数内部可以修改主调函数中的变量;所
以未来函数中只是需要主调函数中的变量值来实现计算,就可以采⽤传值调用。如果函数内部要修改
主调函数中的变量的值,就需要传址调用。
五、指针与数组
5.1 数组名的理解
在C语言中,数组名是数组首元素的地址,但是经过实验会发现有两个例外
一个就是sizeof(数组名),sizeof中单独放数组名,这里的数组名表示整个数组,计算的是整个数组的大小, 单位是字节。
另一个就是**&数组名**,这里的数组名表示整个数组,取出的是整个数组的地址(整个数组的地址和数组首元素 的地址是有区别的)
除此之外,任何地方使用数组名,数组名都表示首元素的地址。
下面我们看个有趣的代码:
#include<stdio.h> int main() { int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; printf("&arr[0] = %p\n", &arr[0]); printf("arr = %p\n", arr); printf("&arr = %p\n", &arr); return 0; }
我们可以看到,三种打印结果都一模一样,那么,它们的区别在哪里呢?
别急,我们将上面的代码在进行一下扩展:
#include<stdio.h> int main() { int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; printf("&arr[0] = %p\n", &arr[0]); printf("&arr[0] + 1 = %p\n ", &arr[0]); printf("arr = %p\n", arr); printf("arr + 1 = %p\n", arr + 1); printf("&arr = %p\n", &arr); printf("&arr + 1 = %p\n", &arr + 1); return 0; }
我们将它们都进行加一处理后,在打印它们的地址,就可以看出差别啦。数组名加一在地址上显示增加了四个字节,而&数组名加一后却增加了四十个字节,这是为什么呢?
我们知道整型占四个字节,而数组中有十个元素,也就是说这个数组总共占四十个字节,这样我们就明白了,原来数组名加一就是增加了一个整形元素的字节,而&数组名加一则是跳过一整个数组。
到这里大家应该搞清楚数组名的意义了吧。
5.2 指针访问数组
结合前面所学的知识,我们就可以很方便的利用指针来访问数组。
#include<stdio.h> int main() { int arr[10] = { 0 }; int sz = sizeof(arr) / sizeof(arr[0]); // 判断数组元素个数 int* p = arr; int i = 0; for (i = 0; i < sz; i++) // 输入 { scanf("%d", p + i); // 写法一 // scanf("%d", arr + i); // 写法二 } for (i = 0; i < sz; i++) // 输出 { printf("%d ", p[i]); } return 0; }
在第18行的地方,将*(p+i)换成p[i]也是能够正常打印的,所以本质上p[i] 是等价于 *(p+i)。
同理arr[i] 应该等价于 *(arr+i),数组元素的访问在编译器处理的时候,也是转换成首元素的地址+偏移
量求出元素的地址,然后解引用来访问的。
5.3 一维数组传参的本质
我们之前都是在函数外部计算数组的元素个数,那我们可以把数组传给⼀个函数后,函数内部求数组的元素个数吗?
#include<stdio.h> void test(int arr[]) { int sz2 = sizeof(arr) / sizeof(arr[0]); printf("sz2 = %d\n", sz2); } int main() { int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; int sz1 = sizeof(arr) / sizeof(arr[0]); // 计算数组中的元素个数 printf("sz1 = %d\n", sz1); test(arr); return 0; }
通过上面的代码我们发现函数内部没有正确获取数组的元素个数。
前面我们说到:数组名是数组首元素的地址;那么在数组传参的时候,传递的是数组名,也就是说本质上数组传参传递的是数组首元素的地址。
所以函数形参的部分理论上应该使用指针变量来接收首元素的地址。那么在函数内部我们写sizeof(arr) 计算的是⼀个地址的大小(单位字节)而不是数组的大小(单位字节)。正是因为函数的参数部分是本质是指针,所以在函数内部是没办法求的数组元素个数的。
#include<stdio.h> //void test(int arr[]) // 参数写成数组形式,本质上还是指针 //{ // printf("%d\n", sizeof(arr)); //} void test(int* arr) // 参数写成指针形式 { printf("%d\n", sizeof(arr)); // 计算⼀个指针变量的⼤⼩ } int main() { int arr[10] = { 1,2,3,4,5,6,7,8,9,10 }; test(arr); return 0; }
总结:⼀维数组传参,形参的部分可以写成数组的形式,也可以写成指针的形式。