初识指针
前言
C语言指针是一种变量,它存储了另一个变量的内存地址。通过指针,我们可以直接访问内存中的数据,从而实现灵活的数据操作。
指针是编程中的一个概念,它存储的是内存地址,指向某个变量。通过指针,可以直接访问和操作内存中的数据,提高程序效率。但使用指针时需小心,避免空指针和野指针等问题,确保程序安全稳定。
1. 内存和地址
1.1 内存
在讲内存和地址之前,我们想有个生活中的案例:
假设有一栋宿舍楼,把你放在楼里,楼上有100个房间,但是房间没有编号,你的一个朋友来找你玩,如果想找到你,就得挨个房子去找,这样效率很低,但是我们如果根据楼层和楼层的房间的情况,给每个房间编上号,如:
一楼:101,102,103... 二楼:201,202,203.... ...
有了房间号,如果你的朋友得到房间号,就可以快速的找房间,找到你。
生活中,每个房间有了房间号,就能提高效率,能快速的找到房间。
如果把上面的例子对照到计算中,又是怎么样呢?
我们知道计算上CPU(中央处理器)在处理数据的时候,需要的数据是在内存中读取的,处理后的数据也会放回内存中,那我们买电脑的时候,电脑上内存是8GB/16GB/32GB等,那这些内存空间如何高效的管理呢?
其实也是把内存划分为一个个的内存单元,每个内存单元的大小取1个字节。
计算机中常见的单位(补充):
一个比特位可以存储一个2进制的位1或者0
其中,每个内存单元,相当于一个学生宿舍,一个人字节空间里面能放8个比特位,就好比同学们住的八人间,每个人是一个比特位。
每个内存单元也都有一个编号(这个编号就相当于宿舍房间的门牌号),有了这个内存单元的编号,CPU就可以快速找到一个内存空间。
生活中我们把门牌号也叫地址,在计算机中我们把内存单元的编号也称为地址。C语言中给地址起了新的名字叫:指针。
所以我们可以理解为:内存单元的编号==地址==指针
1.2 究竟该如何理解编址
CPU访问内存中的某个字节空间,必须知道这个字节空间在内存的什么位置,而因为内存中字节很多,所以需要给内存进行编址(就如同宿舍很多,需要给宿舍编号一样)。
计算机中的编址,并不是把每个字节的地址记录下来,而是通过硬件设计完成的。
钢琴、吉他上面没有写上“都瑞咪发嗦啦”这样的信息,但演奏者照样能够准确找到每一个琴弦的每一个位置,这是为何?因为制造商已经在乐器硬件层面上设计好了,并且所有的演奏者都知道。本质是一种约定出来的共识!硬件编址也是如此
首先,必须理解,计算机内是有很多的硬件单元,而硬件单元是要互相协同工作的。所谓的协同,至少相互之间要能够进行数据传递。但是硬件与硬件之间是互相独立的,那么如何通信呢?答案很简单,用"线"连起来。而CPU和内存之间也是有大量的数据交互的,所以,两者必须也用线连起来。不过,我们今天关心一组线,叫做地址总线。
我们可以简单理解,32位机器有32根地址总线,每根线只有两态,表示0,1【电脉冲有无】,那么一根线,就能表示2种含义,2根线就能表示4种含义,依次类推。32根地址线,就能表示2^32种含义,每一种含义都代表一个地址。地址信息被下达给内存,在内存上,就可以找到该地址对应的数据,将数据在通过数据总线传入CPU内寄存器。
2. 指针变量和地址
2.1 取地址操作符(&)
理解了内存和地址的关系,我们再回到C语言,在C语言中创建变量其实就是向内存申请空间,比如:
#include <stdio.h> int main() { int a = 10; return 0; }
比如,上述的代码就是创建了整型变量a,内存中申请4个字节,用于存放整数10,其中每个字节都有地址,上图中4个字节的地址分别是:
那我们如何能得到a
的地址呢?
这里就得学习一个操作符(&
)-取地址操作符
#include <stdio.h> int main() { int a = 10; &a; //取出a的地址 printf("%p\n", &a); return 0; }
按照我画图的例子,会打印处理:006FFD70
&a
取出的是a所占4个字节中地址较小的字节的地址
编译器每次运行,分配的地址不一样
虽然整型变量占用4个字节,我们只要知道了第一个字节地址,顺藤摸瓜访问到4个字节的数据也是可行的。
2.2 指针变量和解引用操作符(*)
2.2.1 指针变量
那我们通过取地址操作符(&
)拿到的地址是一个数值,比如:0x006FFD70
,这个数值有时候也是需要 存储起来,方便后期再使用的,那我们把这样的地址值存放在哪里呢?
答案是:指针变量中。
比如:
#include <stdio.h> int main() { int a = 10; int* pa = &a; //取出a的地址并存储到指针变量pa中 return 0; }
指针变量也是一种变量,这种变量就是用来存放地址的,存放在指针变量中的值都会理解为地址
2.2.2 如何拆解指针类型
我们看到pa
的类型是 int*
,我们该如何理解指针的类型呢?
int a = 10; int * pa = &a;
这里pa
左边写的是 int*
, *
是在说明pa
是指针变量,而前面的 int
是在说明pa
指向的是整型(int)
类型的对象。
那如果有一个char
类型的变量ch
,ch
的地址,要放在什么类型的指针变量中呢?
char ch = 'w'; pc = &ch; //pc 的类型怎么写呢?
2.2.3 解引用操作符
我们将地址保存起来,未来是要使用的,那怎么使用呢?
在现实生活中,我们使用地址要找到一个房间,在房间里可以拿去或者存放物品。 C语言中其实也是一样的,我们只要拿到了地址(指针),就可以通过地址(指针)找到地址(指针)指向的对象,这里必须学习一个操作符叫解引用操作符(*
)。
#include <stdio.h> int main() { int a = 100; int* pa = &a; *pa = 0; return 0; }
上面代码中第7行就使用了解引用操作符, *pa
的意思就是通过pa中存放的地址,找到指向的空间,*pa
其实就是a变量了;所以*pa=0
,这个操作符是把a
改成了0
.
有读者肯定在想,这里如果目的就是把a改成0的话,写成 a = 0;
不就完了,为啥非要使用指针呢?
其实这里是把a
的修改交给了pa
来操作,这样对a
的修改,就多了一种的途径,写代码就会更加灵活,后期慢慢就能理解了。
2.3 指针变量的大小
前面的内容我们了解到,32位机器假设有32根地址总线,每根地址线出来的电信号转换成数字信号后是1或者0,那我们把32根地址线产生的2进制序列当做一个地址,那么一个地址就是32个bit位,需要4个字节才能存储。
如果指针变量是用来来存放地址的,那么指针变的大小就得是4个字节的空间才可以。
同理64位机器,假设有64根地址线,一个地址就是64个二进制位组成的二进制序列,存储起来就需要8个字节的空间,指针变的大小就是8个字节。
#include <stdio.h> //指针变量的大小取决于地址的大小 //32位平台下地址是32个bit位(即4个字节) //64位平台下地址是64个bit位(即8个字节) int main() { printf("%zd\n", sizeof(char *)); printf("%zd\n", sizeof(short *)); printf("%zd\n", sizeof(int *)); printf("%zd\n", sizeof(double *)); return 0; }
结论:
- 32位平台下地址是32个bit位,指针变量大小是4个字节
- 64位平台下地址是64个bit位,指针变量大小是8个字节
- 注意指针变量的大小和类型是无关的,只要指针类型的变量,在相同的平台下,大小都是相同的。
3. 指针变量类型的意义
指针变量的大小和类型无关,只要是指针变量,在同一个平台下,大小都是一样的,为什么还要有各种各样的指针类型呢?
其实指针类型是有特殊意义的,我们接下来继续学习。
3.1 指针的解引用
对比,下面2段代码,主要在调试时观察内存的变化。
//代码1 #include <stdio.h> int main() { int n = 0x11223344; int *pi = &n; *pi = 0; return 0; }
//代码2 #include <stdio.h> int main() { int n = 0x11223344; char *pc = (char *)&n; *pc = 0; return 0; }
调试我们可以看到,代码1会将n的4个字节全部改为0,但是代码2只是将n的第一个字节改为0。
结论:指针的类型决定了,对指针解引用的时候有多大的权限(一次能操作几个字节)。
比如: char*
的指针解引用就只能访问一个字节,而 int*
的指针的解引用就能访问四个字节。
3.2 指针±整数
先看一段代码,调试观察地址的变化。
#include <stdio.h> int main() { int n = 10; char *pc = (char*)&n; int *pi = &n; printf("%p\n", &n); printf("%p\n", pc); printf("%p\n", pc+1); printf("%p\n", pi); printf("%p\n", pi+1); return 0; }
代码运行的结果如下:
我们可以看出, char*
类型的指针变量+1跳过1个字节, int*
类型的指针变量+1跳过了4个字节。
这就是指针变量的类型差异带来的变化。
结论:指针的类型决定了指针向前或者向后走一步有多大(距离)。
3.3 void*指针
在指针类型中有一种特殊的类型是 void*
类型的,可以理解为无具体类型的指针(或者叫泛型指针),这种类型的指针可以用来接受任意类型地址。但是也有局限性, void*
类型的指针不能直接进行指针的±整数和解引用的运算。
举例:
#include <stdio.h> int main() { int a = 10; int* pa = &a; char* pc = &a; return 0; }
在上面的代码中,将一个int类型的变量的地址赋值给一个char*
类型的指针变量。编译器给出了一个警告(如下图),是因为类型不兼容。而使用void*
类型就不会有这样的问题。
使用void*
类型的指针接收地址:
#include <stdio.h> int main() { int a = 10; void* pa = &a; void* pc = &a; *pa = 10; *pc = 0; return 0; }
VS编译代码的结果:
这里我们可以看到, void*
类型的指针可以接收不同类型的地址,但是无法直接进行指针运算。
那么 void*
类型的指针到底有什么用呢?
一般 void*
类型的指针是使用在函数参数的部分,用来接收不同类型数据的地址,这样的设计可以实现泛型编程的效果。
4. const修饰指针
4.1 const修饰变量
变量是可以修改的,如果把变量的地址交给一个指针变量,通过指针变量的也可以修改这个变量。
但是如果我们希望一个变量加上一些限制,不能被修改,怎么做呢?这就是const
的作用。
#include <stdio.h> int main() { int m = 0; m = 20; //m是可以修改的 const int n = 0; n = 20; //n是不能被修改的 return 0; }
上述代码中n
是不能被修改的,其实n
本质是变量,只不过被const
修饰后,在语法上加了限制,只要我们在代码中对n
进行修改,就不符合语法规则,就报错,致使没法直接修改n。
但是如果我们绕过n
,使用n
的地址,去修改n
就能做到了,虽然这样做是在打破语法规则。
#include <stdio.h> int main() { const int n = 0; printf("n = %d\n", n); int*p = &n; *p = 20; printf("n = %d\n", n); return 0; }
输出结果:
我们可以看到这里一个确实修改了,但是我们还是要思考一下,为什么n
要被const
修饰呢?就是为了不能被修改,如果p
拿到n
的地址就能修改n
,这样就打破了const
的限制,这是不合理的,所以应该让p
拿到n
的地址也不能修改n
,那接下来怎么做呢?
4.2 const修饰指针变量
我们看下面代码,来分析
#include <stdio.h> //代码1 void test1() { int n = 10; int m = 20; int *p = &n; *p = 20; //ok? p = &m; //ok? } void test2() { //代码2 int n = 10; int m = 20; const int* p = &n; *p = 20; //ok? p = &m; //ok? } void test3() { int n = 10; int m = 20; int *const p = &n; *p = 20; //ok? p = &m; //ok? } void test4() { int n = 10; int m = 20; int const * const p = &n; *p = 20; //ok? p = &m; //ok? } int main() { //测试无const修饰的情况 test1(); //测试const放在*的左边情况 test2(); //测试const放在*的右边情况 test3(); //测试*的左右两边都有const test4(); return 0; }
结论:const
修饰指针变量的时候?
const
如果放在*
的左边,修饰的是指针指向的内容,保证指针指向的内容不能通过指针来改变。但是指针变量本身的内容可变。const
如果放在*
的右边,修饰的是指针变量本身,保证了指针变量的内容不能修改,但是指针指向的内容,可以通过指针改变。
5. 指针运算
指针的基本运算有三种,分别是:
- 指针±整数
- 指针-指针
- 指针的关系运算
5.1 指针±整数
因为数组在内存中是连续存放的,只要知道第一个元素的地址,顺藤摸瓜就能找到后面的所有元素。
int arr[10] = {1,2,3,4,5,6,7,8,9,10};
#include <stdio.h> //指针+- 整数 int main() { int arr[10] = {1,2,3,4,5,6,7,8,9,10}; int *p = &arr[0]; int i = 0; int sz = sizeof(arr)/sizeof(arr[0]); for(i=0; i<sz; i++) { printf("%d ", *(p+i)); //p+i 这里就是指针+整数 } return 0; }
5.2 指针-指针
两个指针相减的结果是它们之间的地址差,以字节为单位。在 C 语言中,指针减指针通常用于计算数组中两个元素之间的距离,也可以用于确定动态分配的内存块的大小。
两个指针相减,指针必须指向一段连续空间,减完之后的结构代表两个指针之间相差元素的个数
//指针-指针 #include <stdio.h> int my_strlen(char *s) { char *p = s; while(*p != '\0' ) p++; return p-s; } int main() { printf("%d\n", my_strlen("abc")); return 0; }
5.3 指针的关系运算
//指针的关系运算 #include <stdio.h> int main() { int arr[10] = {1,2,3,4,5,6,7,8,9,10}; int *p = &arr[0]; int i = 0; int sz = sizeof(arr)/sizeof(arr[0]); while(p<arr+sz) //指针的大小比较 { printf("%d ", *p); p++; } return 0; }
6. 野指针
概念:野指针就是指针指向的位置是不可知的(随机的、不正确的、没有明确限制的)
6.1 野指针成因
- 指针未初始化
#include <stdio.h> int main() { int *p; //局部变量指针未初始化,默认为随机值 *p = 20; return 0; }
- 指针越界访问
#include <stdio.h> int main() { int arr[10] = {0}; int *p = &arr[0]; int i = 0; for(i=0; i<=11; i++) { //当指针指向的范围超出数组arr的范围时,p就是野指针 *(p++) = i; } return 0; }
- 指针指向的空间释放
#include <stdio.h> int* test() { int n = 100; return &n; } int main() { int*p = test(); printf("%d\n", *p); return 0; }
6.2 如何规避野指针
6.2.1 指针初始化
如果明确知道指针指向哪里就直接赋值地址,如果不知道指针应该指向哪里,可以给指针赋值NULL
.
NULL
是C语言中定义的一个标识符常量,值是0
,0
也是地址,这个地址是无法使用的,读写该地址会报错
#ifdef __cplusplus #define NULL 0 #else #define NULL ((void *)0) #endif
初始化如下:
#include <stdio.h> int main() { int num = 10; int*p1 = # int*p2 = NULL; return 0; }
6.2.2 小心指针越界
一个程序向内存申请了哪些空间,通过指针也就只能访问哪些空间,不能超出范围访问,超出了就是越界访问。
6.2.3 指针变量不再使用时,及时置NULL,指针使用之前检查有效性
当指针变量指向一块区域的时候,我们可以通过指针访问该区域,后期不再使用这个指针访问空间的时候,我们可以把该指针置为NULL
。
因为约定俗成的一个规则就是:只要是NULL
指针就不去访问,同时使用指针之前可以判断指针是否为NULL
。
我们可以把野指针想象成野狗,野狗放任不管是非常危险的,所以我们可以找一棵树把野狗拴起来,就相对安全了,给指针变量及时赋值为NULL
,其实就类似把野狗栓前来,就是把野指针暂时管理起来。
不过野狗即使拴起来我们也要绕着走,不能去挑逗野狗,有点危险;对于指针也是,在使用之前,我们也要判断是否为NULL
,看看是不是被拴起来起来的野狗,如果是不能直接使用,如果不是我们再去使用。
int main() { int arr[10] = {1,2,3,4,5,67,7,8,9,10}; int *p = &arr[0]; for(i=0; i<10; i++) { *(p++) = i; } //此时p已经越界了,可以把p置为NULL p = NULL; //下次使用的时候,判断p不为NULL的时候再使用 //... p = &arr[0]; //重新让p获得地址 if(p != NULL) //判断 { //... } return 0; }
6.2.4 避免返回局部变量的地址
如造成野指针的第3个例子,不要返回局部变量的地址。
7. assert断言
assert.h
头文件定义了宏 assert()
,用于在运行时确保程序符合指定条件,如果不符合,就报错终止运行。这个宏常常被称为“断言”。
assert(p != NULL);
上面代码在程序运行到这一行语句时,验证变量 p
是否等于 NULL
。如果确实不等于 NULL
,程序继续运行,否则就会终止运行,并且给出报错信息提示。
assert()
宏接受一个表达式作为参数。如果该表达式为真(返回值非零), assert()
不会产生
任何作用,程序继续运行。如果该表达式为假(返回值为零), assert()
就会报错,在标准错误流 stderr
中写入一条错误信息,显示没有通过的表达式,以及包含这个表达式的文件名和行号。
assert()
的使用对程序员是非常友好的,使用 assert()
有几个好处:它不仅能自动标识文件和出问题的行号,还有一种无需更改代码就能开启或关闭 assert()
的机制。如果已经确认程序没有问题,不需要再做断言,就在 #include <assert.h>
语句的前面,定义一个宏 NDEBUG
。
#define NDEBUG #include <assert.h>
然后,重新编译程序,编译器就会禁用文件中所有的 assert()
语句。如果程序又出现问题,可以移除这条 #define NDBUG
指令(或者把它注释掉),再次编译,这样就重新启用了 assert()
语句。
assert()
的缺点是,因为引入了额外的检查,增加了程序的运行时间。
一般我们可以在 Debug 中使用,在 Release 版本中选择禁用 assert
就行,在 VS 这样的集成开发环境中,在 Release 版本中,直接就是优化掉了。这样在debug版本写有利于程序员排查问题,在 Release 版本不影响用户使用时程序的效率。
8. 指针的使用和传址调用
8.1 strlen的模拟实现
库函数strlen
的功能是求字符串长度,统计的是字符串中 \0
之前的字符的个数。
函数原型如下:
size_t strlen ( const char * str );
参数str接收一个字符串的起始地址,然后开始统计字符串中 \0
之前的字符个数,最终返回长度。
如果要模拟实现只要从起始地址开始向后逐个字符的遍历,只要不是 \0
字符,计数器就+1,这样直到 \0
就停止。
参考代码如下:
int my_strlen(const char * str) { int count = 0; assert(str); while(*str) { count++; str++; } return count; } int main() { int len = my_strlen("abcdef"); printf("%d\n", len); return 0; }
8.2 传值调用和传址调用
学习指针的目的是使用指针解决问题,那什么问题,非指针不可呢?
例如:写一个函数,交换两个整型变量的值一番思考后,我们可能写出这样的代码:
#include <stdio.h> void Swap1(int x, int y) { int tmp = x; x = y; y = tmp; } int main() { int a = 0; int b = 0; scanf("%d %d", &a, &b); printf("交换前:a=%d b=%d\n", a, b); Swap1(a, b); printf("交换后:a=%d b=%d\n", a, b); return 0; }
当我们运行代码,结果如下:
我们发现其实没产生交换的效果,这是为什么呢?
调试一下,试试呢?
我们发现在main
函数内部,创建了a
和b
,a
的地址是0x00cffdd0
,b的地址是0x00cffdc4
,在调用Swap1
函数时,将a
和b
传递给了Swap1
函数,在Swap1
函数内部创建了形参x
和y
接收a
和b
的值,但是x
的地址是0x00cffcec
,y
的地址是0x00cffcf0
,x
和y
确实接收到了a
和b
的值,不过x
的地址和a
的地址不一样,y
的地址和b
的地址不一样,相当于x
和y
是独立的空间,那么在Swap1
函数内部交换x
和y
的值,自然不会影响a
和b
,当Swap1
函数调用结束后回到main
函数,a
和b
的没法交换。Swap1
函数在使用的时候,是把变量本身直接传递给了函数,这种调用函数的方式我们之前在函数的时候就知道了,这种叫传值调用。
结论:实参传递给形参的时候,形参会单独创建一份临时空间来接收实参,对形参的修改不影响实参。所以Swap
是失败的了。那怎么办呢?
我们现在要解决的就是当调用Swap
函数的时候,Swap
函数内部操作的就是main
函数中的a
和b
,直接将a
和b
的值交换了。那么就可以使用指针了,在main
函数中将a
和b
的地址传递给Swap
函数,Swap
函数里边通过地址间接的操作main
函数中的a
和b
,并达到交换的效果就好了。
#include <stdio.h> void Swap2(int*px, int*py) { int tmp = 0; tmp = *px; *px = *py; *py = tmp; } int main() { int a = 0; int b = 0; scanf("%d %d", &a, &b); printf("交换前:a=%d b=%d\n", a, b); Swap1(&a, &b); printf("交换后:a=%d b=%d\n", a, b); return 0; }
首先看输出结果:
我们可以看到实现成Swap2
的方式,顺利完成了任务,这里调用Swap2
函数的时候是将变量的地址传递给了函数,这种函数调用方式叫:传址调用。
传址调用,可以让函数和主调函数之间建立真正的联系,在函数内部可以修改主调函数中的变量;所以未来函数中只是需要主调函数中的变量值来实现计算,就可以采用传值调用。如果函数内部要修改主调函数中的变量的值,就需要传址调用。