【C语言基础】:深入理解指针(二)

简介: 【C语言基础】:深入理解指针(二)

深入理解指针

上期回顾:【C语言基础】:深入理解指针(一)


一、指针运算

指针的基本运算有三种,分别是:

1. 指针 ± 整数

2. 指针 - 指针

3. 指针的关系运算


1. 指针 ± 整数

在C语言中,我们知道数组在内存中是连续存放的,所以我们只要知道了数组第一个元素的地址,就可以顺藤摸瓜找到后面元素的地址。

int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
#include<stdio.h>
// 指针 +- 整数
int main()
{
  int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
  int* p = &arr[0];
  int sz = sizeof(arr) / sizeof(arr[0]); // 计算元素个数
  int i = 0;
  for (i = 0; i < sz; i++)
  {
    printf("%d ", *(p + i));  // 指针 +- 整数
  }
  return 0;
}

2810619eebf8fe80b298bf63a28b58a8_c32e81d40e5d452b83ea08980230185c.png

上述示例中,通过 *(p + i) 的方式可以实现指针向前移动 i 个位置,并访问对应位置的数组元素。


2. 指针 - 指针

在C语言中,不止整数之间可以进行运算,其实指针与指针之间也可以进行运算,指针与指针之间可以进行减法运算,两个指针相减得到的是一个整数,表示它们之间相隔元素的个数。

#include<stdio.h>
// 指针 - 指针
// 模拟strlen库函数
my_strlen(char *s)
{
  char* p = s;
  while (*p != '\0')
    p++;
  return p - s;
}

int main()
{
  printf("%d\n", my_strlen("abc"));
  return 0;
}

3c6f93a1db3c68692fb8b26b12362533_a269abb188144de387cb0d60e314c733.png


3. 指针的关系运算

#include<stdio.h>
int main()
{
  int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
  int* p = &arr[0];
  int sz = sizeof(arr) / sizeof(arr[0]);  // 计算数组之间的元素个数
  int i = 0;
  while (p < arr + sz)  // 指针的大小比较
  {
    printf("%d ", *p);
    p++;
  }
  return 0;
}

ff7a416ba9c7c577e2bf8f9556b4946b_9d7766483ade4638b601ea318e3ae05b.png

在上述示例中,通过指针 p 和数组大小 sz 的比较,保证了在不越界的情况下遍历整个数组。


二、野指针

野指针就是指指针指向的位置是不可知的(随机的、不正确的、没有明确限制的)


1. 野指针成因

指针未初始化


局部变量未初始化,默认随机值

int main()
{
  int* p;  // 局部变量未初始化,默认随机值
  *p = 30;
  return 0;
}

指针越界访问

int main()
{
  int arr[10] = { 0 };
  int* p = &arr[0];
  int i = 0;
  for (i = 0; i <= 11; i++)
  {
    // 当指针指向的范围超出数组arr的范围时,p就是野指针
    *(p++) = i;
  }
  return 0;
}

509624248030bf3ea782c84565b5ad73_62786db61c7a4e02a130bd4681ea50b2.png

可以看到,调试运行之后程序直接就抛出异常了,所以为了安全最好要避免野指针的出现。


指针指向的空间释放

int* test()
{
  int n = 100;
  return &n;
}

int main()
{
  int* p = test();
  printf("%d\n", *p);
  return 0;
}

在函数 test() 中,指针返回指向的是一个局部变量 n 的地址,在函数执行完毕后,n 的内存空间会被释放掉,导致返回的指针指向的内存区域已经无效。


2. 如何避免野指针

指针初始化


如果明确知道指针指向哪里就直接赋值地址,如果不知道指针应该指向哪里,可以给指针赋值NULL,

NULL 是C语言中定义的一个标识符常量,值是0,0也是地址,这个地址是无法使用的,读写该地址会报错。

int main()
{
  int num = 10;
  int* p1 = &num;
  int* p2 = NULL;
  *p1 = 20;
  // *p2 = 20;  // err
  printf("%d\n", *p1);
  // printf("%d\n", *p2);
  return 0;
}

b81d5215a00cb7a720fa2ee41ce95264_ceed967f99124b12a372ad6c8dfb0953.png

可以看到,若是我们直接去访问0这个地址,程序会直接给我们报错。


小心指针越界


一个程序向内存申请了哪些空间,通过指针也就只能访问哪些空间,不能超出范围访问,超出了就是越界访问。


int main()
{
  int arr[10] = { 0 };
  int* p = &arr[0];
  int i = 0;
  for (i = 0; i < 10; i++)
  {
    *(p++) = i;
  }
  return 0;
}

指针变量不再使用时,及时置NULL,指针使用之前检查有效性


当指针变量指向⼀块区域的时候,我们可以通过指针访问该区域,后期不再使用这个指针访问空间的

时候,我们可以把该指针置为NULL。因为约定俗成的⼀个规则就是:只要是NULL指针就不去访问,

同时使用指针之前可以判断指针是否为NULL。


int main()
{
 int arr[10] = {1,2,3,4,5,67,7,8,9,10};
 int *p = &arr[0];
 for(i=0; i<10; i++)
 {
 *(p++) = i;
 }
 //此时p已经越界了,可以把p置为NULL
 p = NULL;
 //下次使⽤的时候,判断p不为NULL的时候再使⽤
 //...
 p = &arr[0];//重新让p获得地址
 if(p != NULL) //判断
 {
 //...
 }
 return 0;
}

避免返回局部变量的地址


三、assert断言

assert.h 头文件定义了宏 assert() ,⽤于在运行时确保程序符合指定条件,如果不符合,就报

错终止运行。这个宏常常被称为“断言”。

assret(p != NULL)

上面代码在程序运行到这一行语句时,验证变量 p 是否等于 NULL 。如果确实不等于 NULL ,程序

继续运行,否则就会终止运行,并且给出报错信息提示。


assert() 宏接受⼀个表达式作为参数。如果该表达式为真(返回值非零), assert() 不会产生

任何作用,程序继续运行。如果该表达式为假(返回值为零), assert() 就会报错,在标准错误

流 stderr 中写入一条错误信息,显示没有通过的表达式,以及包含这个表达式的⽂件名和行号。


assert() 的使用对程序员是非常友好的,使用 assert() 有几个好处:它不仅能自动标识文件和

出问题的行号,还有⼀种无需更改代码就能开启或关闭 assert() 的机制。如果已经确认程序没有问

题,不需要再做断言,就在 #include <assert.h> 语句的前⾯,定义⼀个宏 NDEBUG 。

#define NDEBUG
#include<assert.h>

然后,重新编译程序,编译器就会禁用文件中所有的 assert() 语句。如果程序又出现问题,可以移

除这条 #define NDEBUG 指令(或者把它注释掉),再次编译,这样就重新启用了 assert() 语

句。


assert() 的缺点:因为引入了额外的检查,增加了程序的运行时间。

⼀般我们可以在 Debug 中使用,在 Release 版本中选择禁用 assert 就行,在 VS 这样的集成开

发环境中,在 Release 版本中,直接就是优化掉了。这样在debug版本写有利于程序员排查问题,

在 Release 版本不影响用户使用时程序的效率。


四、指针的使用和传址调用

4.1 strlen的模拟实现

库函数strlen的功能是求字符串长度,统计的是字符串中 \0 之前的字符的个数。

函数原型如下:

size_t strlen ( const char * str );

参数str接收⼀个字符串的起始地址,然后开始统计字符串中 \0 之前的字符个数,最终返回⻓度。

如果要模拟实现只要从起始地址开始向后逐个字符的遍历,只要不是 \0 字符,计数器就+1,这样直

到 \0 就停止。

#include<stdio.h>
#include<assert.h>
int my_strlen(const char* str)
{
  int count = 0;
  assert(str);
  while (*str)
  {
    count++;
    str++;
  }
  return count;
}

int main()
{
  int len = my_strlen("abcdef");
  printf("%d\n", len);
  return 0;
}

5bdee272655c94ae8a62a0930c50f44b_680e79c999114f67bc8ddbb283a178f8.png

4.2 传值调用和传址调用

【示例】:写⼀个函数,交换两个整型变量的值


错误示范

#include<stdio.h>
void Swap1(int x, int y)
{
  int tmp = 0;
  tmp = x;
  x = y;
  y = tmp;
}

int main()
{
  int a = 0;
  int b = 0;
  scanf("%d %d", &a, &b);
  prinf("交换前:%d %d\n", a, b);
  Swap1(a, b);
  printf("交换后:%d %d\n", a, b);
  return 0;
}

1c6d6e29acb835fa3166779d4f9bb122_d1a9a45b159b498dbd6b88bb8e4450f9.png

可以发现,代码运行后未发生交换,这是为什么呢?

338c3c97f9f9eff29375653a8b5870df_93842d7a8b5d46e0b0cb981cdfd05dd2.png

经过调试后我们发现,main函数内部创建的a和b确实传到了Swap函数里的x和y中,但我们查看a和b的地址与Swap函数里的x和y的地址进行对比时,我们就可以发现问题了,它们的地址不一样,这就相当于Swap函数里的x和y是一个独立的空间,在Swap函数内部进行了交换,但却无法返回到main函数中,导致a和b没有实现交换,Swap1函数在使用的时候,是把变量本身直接传递给了函数,这种调用函数的方式我们之前在函数的时候就知道了,这种叫传值调用。


结论:实参传递给形参的时候,形参会单独创建⼀份临时空间来接收实参,对形参的修改不影响实参。


解决办法:我们现在要解决的就是当调用Swap函数的时候,Swap函数内部操作的就是main函数中的a和b,直接 将a和b的值交换了。那么就可以使用指针了,在main函数中将a和b的地址传递给Swap函数,Swap函数里边通过地址间接的操作main函数中的a和b,并达到交换的效果就好了。


#include<stdio.h>
void Swap2(int* px, int* py)
{
  int tmp = 0;
  tmp = *px;
  *px = *py;
  *py = tmp;
}

int main()
{
  int a = 0;
  int b = 0;
  scanf("%d %d", &a, &b);
  printf("交换前:%d %d\n", a, b);
  Swap2(&a, &b);
  printf("交换后:%d %d\n", a, b);
  return 0;
}

78289d0adcfb966700ac33adef933ebd_af593d98a77242d19645d9637cb621a6.png

我们可以看到实现成Swap2的方式,顺利完成了任务,这⾥调用Swap2函数的时候是将变量的地址传

递给了函数,这种函数调用方式叫:传址调用。


传址调用,可以让函数和主调函数之间建立真正的联系,在函数内部可以修改主调函数中的变量;所

以未来函数中只是需要主调函数中的变量值来实现计算,就可以采⽤传值调用。如果函数内部要修改

主调函数中的变量的值,就需要传址调用。


五、指针与数组

5.1 数组名的理解

在C语言中,数组名是数组首元素的地址,但是经过实验会发现有两个例外

一个就是sizeof(数组名),sizeof中单独放数组名,这里的数组名表示整个数组,计算的是整个数组的大小, 单位是字节。

另一个就是**&数组名**,这里的数组名表示整个数组,取出的是整个数组的地址(整个数组的地址和数组首元素 的地址是有区别的)

除此之外,任何地方使用数组名,数组名都表示首元素的地址。


下面我们看个有趣的代码:

#include<stdio.h>
int main()
{
  int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
  printf("&arr[0]   = %p\n", &arr[0]);
  printf("arr       = %p\n", arr);
  printf("&arr      = %p\n", &arr);
  return 0;
}

f00450b7dab5251bcc475cb72a1339e3_73f60c9bcf3140f5898bfbc49eb238f9.png

我们可以看到,三种打印结果都一模一样,那么,它们的区别在哪里呢?

别急,我们将上面的代码在进行一下扩展:


#include<stdio.h>
int main()
{
  int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
  printf("&arr[0]      = %p\n", &arr[0]);
  printf("&arr[0] + 1  = %p\n ", &arr[0]);
  printf("arr          = %p\n", arr);
  printf("arr + 1      = %p\n", arr + 1);
  printf("&arr         = %p\n", &arr);
  printf("&arr + 1     = %p\n", &arr + 1);
  return 0;
}

2abfc2e26bd81dffe45fdb57e260503d_1c00f163f581420e842af5d1c5f33587.png

我们将它们都进行加一处理后,在打印它们的地址,就可以看出差别啦。数组名加一在地址上显示增加了四个字节,而&数组名加一后却增加了四十个字节,这是为什么呢?

我们知道整型占四个字节,而数组中有十个元素,也就是说这个数组总共占四十个字节,这样我们就明白了,原来数组名加一就是增加了一个整形元素的字节,而&数组名加一则是跳过一整个数组。

到这里大家应该搞清楚数组名的意义了吧。


5.2 指针访问数组

结合前面所学的知识,我们就可以很方便的利用指针来访问数组。


#include<stdio.h>
int main()
{
  int arr[10] = { 0 };
  int sz = sizeof(arr) / sizeof(arr[0]);  // 判断数组元素个数
  int* p = arr;
  int i = 0;
  for (i = 0; i < sz; i++)  // 输入
  {
    scanf("%d", p + i);  // 写法一
    // scanf("%d", arr + i);  // 写法二
  }
  for (i = 0; i < sz; i++)  // 输出
  {
    printf("%d ", p[i]);
  }
  return 0;
}

在第18行的地方,将*(p+i)换成p[i]也是能够正常打印的,所以本质上p[i] 是等价于 *(p+i)。

同理arr[i] 应该等价于 *(arr+i),数组元素的访问在编译器处理的时候,也是转换成首元素的地址+偏移

量求出元素的地址,然后解引用来访问的。


5.3 一维数组传参的本质

我们之前都是在函数外部计算数组的元素个数,那我们可以把数组传给⼀个函数后,函数内部求数组的元素个数吗?


#include<stdio.h>
void test(int arr[])
{
  int sz2 = sizeof(arr) / sizeof(arr[0]);
  printf("sz2 = %d\n", sz2);
}

int main()
{
  int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
  int sz1 = sizeof(arr) / sizeof(arr[0]);  // 计算数组中的元素个数
  printf("sz1 = %d\n", sz1);
  test(arr);
  return 0;
}

bc83234e354e6a0ba752ed69b9f9b263_f3cdc9f1f5d6485893cbc8ef91f6eab2.png

通过上面的代码我们发现函数内部没有正确获取数组的元素个数。

前面我们说到:数组名是数组首元素的地址;那么在数组传参的时候,传递的是数组名,也就是说本质上数组传参传递的是数组首元素的地址。


所以函数形参的部分理论上应该使用指针变量来接收首元素的地址。那么在函数内部我们写sizeof(arr) 计算的是⼀个地址的大小(单位字节)而不是数组的大小(单位字节)。正是因为函数的参数部分是本质是指针,所以在函数内部是没办法求的数组元素个数的。


#include<stdio.h>
//void test(int arr[])  // 参数写成数组形式,本质上还是指针
//{
//  printf("%d\n", sizeof(arr));
//}

void test(int* arr)  // 参数写成指针形式
{
  printf("%d\n", sizeof(arr));  // 计算⼀个指针变量的⼤⼩
}

int main()
{
  int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
  test(arr);
  return 0;
}

image.png

总结:⼀维数组传参,形参的部分可以写成数组的形式,也可以写成指针的形式。

相关文章
|
1月前
|
存储 C语言
【C语言篇】深入理解指针3(附转移表源码)
【C语言篇】深入理解指针3(附转移表源码)
36 1
|
26天前
|
C语言
【c语言】指针就该这么学(1)
本文详细介绍了C语言中的指针概念及其基本操作。首先通过生活中的例子解释了指针的概念,即内存地址。接着,文章逐步讲解了指针变量的定义、取地址操作符`&`、解引用操作符`*`、指针变量的大小以及不同类型的指针变量的意义。此外,还介绍了`const`修饰符在指针中的应用,指针的运算(包括指针加减整数、指针相减和指针的大小比较),以及野指针的概念和如何规避野指针。最后,通过具体的代码示例帮助读者更好地理解和掌握指针的使用方法。
45 0
|
25天前
|
C语言
【c语言】指针就该这么学(3)
本文介绍了C语言中的函数指针、typedef关键字及函数指针数组的概念与应用。首先讲解了函数指针的创建与使用,接着通过typedef简化复杂类型定义,最后探讨了函数指针数组及其在转移表中的应用,通过实例展示了如何利用这些特性实现更简洁高效的代码。
15 2
|
26天前
|
C语言
如何避免 C 语言中的野指针问题?
在C语言中,野指针是指向未知内存地址的指针,可能引发程序崩溃或数据损坏。避免野指针的方法包括:初始化指针为NULL、使用完毕后将指针置为NULL、检查指针是否为空以及合理管理动态分配的内存。
|
26天前
|
C语言
C语言:哪些情况下会出现野指针
C语言中,野指针是指指向未知地址的指针,通常由以下情况产生:1) 指针被声明但未初始化;2) 指针指向的内存已被释放或重新分配;3) 指针指向局部变量,而该变量已超出作用域。使用野指针可能导致程序崩溃或不可预测的行为。
|
1月前
|
存储 C语言
C语言32位或64位平台下指针的大小
在32位平台上,C语言中指针的大小通常为4字节;而在64位平台上,指针的大小通常为8字节。这反映了不同平台对内存地址空间的不同处理方式。
|
1月前
|
存储 算法 C语言
C语言:什么是指针数组,它有什么用
指针数组是C语言中一种特殊的数据结构,每个元素都是一个指针。它用于存储多个内存地址,方便对多个变量或数组进行操作,常用于字符串处理、动态内存分配等场景。
|
1月前
|
存储 C语言
C语言指针与指针变量的区别指针
指针是C语言中的重要概念,用于存储内存地址。指针变量是一种特殊的变量,用于存放其他变量的内存地址,通过指针可以间接访问和修改该变量的值。指针与指针变量的主要区别在于:指针是一个泛指的概念,而指针变量是具体的实现形式。
|
1月前
|
C语言
C语言指针(3)
C语言指针(3)
11 1
|
1月前
|
C语言
C语言指针(2)
C语言指针(2)
13 1