【C进阶】——详解10个C语言中常见的字符串操作函数及其模拟实现(一)

简介: 【C进阶】——详解10个C语言中常见的字符串操作函数及其模拟实现(一)

这篇文章给大家介绍一些C语言中处理字符串的 库函数 以及它们的使用和注意事项,一起来学习吧!!!

本篇文章介绍的函数需要包含的头文件都是#include


前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串 中或者 字符数组 中。

字符串常量 适用于那些对它不做修改的字符串函数.


1.求字符串长度——strlen

strlen是库函数,我们要知道库函数的参数和它的功能是C语言标准规定好的,那我们怎么看它的参数是什么呢?


之前的文章里给大家提到过一个查询库函数的网站(cplusplus.com):

链接: link


那我们来看一下C语言标准规定strlen的参数和功能是怎么样的的:

a8fbcac7312a46779f8cd40a612667fc.png

1.1 使用及注意事项

相信这个函数大家以及比较熟悉了,但这里还是带大家一起来复习一下,并强调一些注意事项:


字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。


举个例子:

#include <string.h>
#include <stdio.h>
int main()
{
  char arr[] = "abcdef";
  char arr2[] = { 'a','b','c','d','e','f','\0' };
  printf("%d\n", strlen(arr));
  printf("%d\n", strlen(arr2));
  return 0;
}

看下结果:

9c9761848c974abb8de22ef3356949b5.png

字符’\0’之前有6个字符,所以结果是6,相信大家都能明白。

参数指向的字符串必须要以 ‘\0’ 结束。

我们知道字符串的结束标志是’\0’,那如果一个字符串中没有’\0’,还能用strlen计算它的长度吗?

int main()
{
  char arr[] = { 'a','b','c','d','e','f' };
  char arr2[] = { 'a','b','f'};
  printf("%d\n", strlen(arr));
  printf("%d\n", strlen(arr2));
  return 0;
}

大家思考一下结果会是什么?

cfa4b9c820174e458c8cf6a6f9a6f6bf.png

19和31,为什么会是这个结果,是巧合吗?我们再运行一次:

2e660ee09e6442c299e9c6a8dfcd8ed9.png

19和31,为什么会是这个结果,是巧合吗?我们再运行一次:

2e660ee09e6442c299e9c6a8dfcd8ed9.png

又一个不同的结果,为啥呢?


因为如果我们不加’\0’,去求一个没有结束标志的字符串,它的结果将会是一个随机值,为什么呢?

因为函数strlen 求的是字符串中’\0’之前的字符个数,但是上面的两个字符串(C语言没有字符串类型,我们放到了字符数组中)中没有’\0’,所以strlen函数就会一直向后寻找,直至遇到’\0’,但数组后面的内存空间放的是什么我们是不知道的,所以我们不知道什么时候会遇到’\0’,因此结果是一个随机值。


注意函数的返回值为size_t,是无符号的( 易错 )


大家可能不是太明白,我们来先看一段代码:

#include <stdio.h>
int main()
{
 const char*str1 = "abcdef";
 const char*str2 = "bbb";
 if(strlen(str2)-strlen(str1)>0)
 {
 printf("str2>str1\n");
 } 
 else
 {
 printf("srt1>str2\n");
 }
 return 0; }

大家思考一下结果是啥?

str1的长度为6,str2的长度为3,所以strlen(str2)-strlen(str1)的结果是-3,小于0,if判断为假,所以打印"srt1>str2"

如果你是这样想的那就错了!!!

我们来看一下结果是啥?

0816b6a7f4744327a241aad4092689af.png

结果是str2>str1,与我们想的不一样,原因就在于函数strlen的返回值为size_t。

解释:9cbcb051de9a46129a49c49cee12f328.png

不知道大家有没有注意到,库函数strlen的返回类型是size_t。

那什么是size_t呢?我们来看一下:

06ef7b3fe9e9400b894bb11642d4ab81.png

怎么看,在vs2022中输入一个size_t,鼠标右键转到定义或直接按F12即可查看:

7e172bfb20a149c698e5a65160f65f8a.png

我们看到,size_t其实就是unsigend int (无符号整型),因为typedef unsigned int size_t的意思其实就是把类型unsigned int 重命名为 size_t。

由于strlen的返回类型是size_t,所以strlen(str2)-strlen(str1)的结果就也是size_t了。

那么3-6=-3,我们知道内存中存的是补码:

a3a7eebec7f0425dba488f22013402cc.png

那如果11111111111111111111111111111101被当作一个无符号整型,转化为10进制将是一个非常大的正数,肯定大于0,所以结果才是str2>str1。


1.2 strlen的模拟实现

那我们现在已经知道了函数strlen的参数以及它的功能,我们是不是可以尝试去模拟实现一下strlen呢?

bb31c2bf839d4e12984b538884b88f13.png

这里我们介绍三种方法去模拟实现strlen:

  1. 计数器方式

怎么实现呢?

把字符串的首字符地址传给函数,用指针接收,用该指针遍历字符串,如果指针指向的内容不是’\0’,计数器++,指针继续向后移动,直至遇到’\0’停止,返回计数器的值。

size_t my_strlen(const char* str) 
{
  int count = 0;
  while (*str)
  {
    count++;
    str++;
  }
  return count;
}

看一下能不能达到效果:

070ce5becec6410ab71e0a67e925ae51.png

  1. 递归实现

怎么递归呢?

我们对传过来的首字符地址直接解引用,如果是’\0’,那就返回0。

如果不是’\0’,那说明至少有一个有效字符,让指针+1,返回1+my_strlen(str+1),直至遇到’\0’,开始回归得出结果。

size_t my_strlen(const char* str) 
{
  if (*str == '\0')
    return 0;
  else
    return 1 + my_strlen(str + 1);
}

也能得到正确结果:3143976073174ff5a4324c4fccc64478.png

  1. 指针-指针

在指针的学习中我们已经知道,指针-指针得到的是两个指针之间的元素个数,那我们让一个指针指向首字符,另一个指针指向’\0’,后者减前者,得到的元素个数不就是字符串长度吗?

size_t my_strlen(char* s) 
{
  char* p = s;
  while (*p != '\0')
    p++;
  return p - s;
}

这样依然可行:

e158d9c17dfa448da304133d2db6f6e2.png

2.字符串拷贝——strcpy

先来认识一下它吧:

2bd6be376ab74e128e053501f521162e.png

2.1 使用及注意事项

源字符串必须以 ‘\0’ 结束

我们知道字符串的结束标志是’\0’,也就是说,strcpy在拷贝源字符串时,遇到’\0’才会停止拷贝,而跟字符串的长度无关,只要不遇到’\0’,就一直往后继续拷贝,那如果我们的源字符串中没有’\0’,会出现什么后果呢?

int main()
{
  char arr1[20] = { 0 };
  char arr2[] = {'a','b','c'};
  strcpy(arr1, arr2);
  return 0;
}

将arr2中的字符串拷贝到arr1中,但是arr2中的字符串并没有’\0’,会出现什么样的结果呢?

062958b0fa3a47bb906c68cf512026a1.png

我们调试可以发现,这样是会发生错误的,因为在字符’a’、‘b’、‘c’的后面并没有放’\0’,所以strcpy会一直向后拷贝,我们不知道什么时候才会遇到’\0’停止下来,而且arr1我们申请的空间也是有限的,也不能无限的向里面放东西,所以这样就有可能造成越界,而且在’a’、‘b’、'c’后面会拷贝什么内容我们也不知道,这是不可行的。

因此,源字符串必须以 ‘\0’ 结束。


会将源字符串中的 ‘\0’ 拷贝到目标空间

strcpy在拷贝的时候会将源字符串的’\0’也拷贝到目标空间


我们来验证一下:

int main()
{
  char arr1[20] = "*****************";
  char arr2[] = "abc";
  strcpy(arr1, arr2);
  printf("%s", arr1);
  return 0;
}

8d1de1ad54124224ac309e070f58fc05.png

  1. 目标空间必须足够大,以确保能存放源字符串

既然我们要把源字符串拷贝放到目标空间,那一定要确保目标空间足够大,能够放得下源字符串,如果目标空间大小不够,肯定也会出现问题的。

int main()
{
  char arr1[] = "abc";
  char arr2[] = "xxxxxx";
  strcpy(arr1, arr2);
  printf("%s", arr1);
  return 0;
}

04c90367ae054272804eda77e875441e.png

  1. 目标空间必须可变

什么意思呢,就是目标空间放的内容必须是可修改的,因为我们要把源字符串的内容拷贝放进目标空间中(相当于修改了目标空间的内容),如果目标空间不可变,那肯定是不行的。

比如:

int main()
{
  char* p = "hello world";
  char arr[] = "abc";
  strcpy(p, arr);
  return 0;
}

f0ba18632e8b435b883839ca7b1d8a48.png

2.2 strcpy的模拟实现

接下来我们来模拟实现一下strcpy,直接上代码:

char* my_strcpy(char* dest, const char* src)
{
  assert(dest && src);
  char* ret = dest;
  while (*dest++ = *src++)
  {
    ;
  }
  return ret;
}

解释一下:

338f04a62fe442038ea6a3d09fd60ce4.png

看一下效果:

e5cd838a15624ec8bf22c030728d2530.png

3.字符串追加函数——strcat

一起来认识一下:

845e10c3d5db477d8f7f5e849a476e8e.png

6c178570e448484588a326c9da2e10a7.png

其实就是在一个字符串的后面追加上另外一个字符串。追加的字符串从目标字符串(即被追加的字符串)的结束标志’\0’处开始追加(会覆盖目标字符串的’\0’),追加至’\0’停止。

演示一下:

#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = "hello ";
  char arr2[] = "world";
  strcat(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

看看效果:

4ed6b2f648a84dbcb75f8a304b7cc5d7.png

3.1使用及注意事项

  1. 源字符串必须以 ‘\0’ 结束。

因为追加的时候还是遇到’\0’停止,如果源字符串中没有’\0’,就会一直继续向后追加,而后面的空间是不属于我们的,里面放的是什么东西也是未知的,这样肯定会出现问题的。

0f0da0cb88214657bdf6fa150cce2582.png

目标空间必须有足够的大,能容纳下源字符串的内容。

32738968d3ab4065affbfc4d64573e54.png

  1. 目标空间必须可修改

跟strcpy一样,要操作的目标空间必须是可变的,因为追加字符串相当于对目标空间做出了修改,所以目标空间必须是可变的,不能是字符串常量。

bbea755f685d40bab8ad1e463aa81184.png

3.2 strcat的模拟实现

现在我们已经知道了strcat的参数和工作原理,那我们就来模拟实现一下它:


怎么搞呢?

我们知道strcat在追加字符串时是从目标字符串的结束标志’\0’处开始追加的(会覆盖掉目标字符串的’\0’),直至遇到’\0’追加结束,当然源字符串的’\0’也会追加上去。


那我们先用一个指针找到目标字符串的’\0’,然后的操作是不是就跟strcpy一样了啊,把源字符串的内容拷贝到目标字符串的’\0’之后不就行了嘛。


实现一下:

char* my_strcat(char* dest, const char* src)
{
  assert(dest && src);
  //1.找到目标字符串的'\0'
  char* p = dest;
  while (*p != '\0')
  {
    p++;
  }
  //2.将源字符串拷贝到目标空间的'\0'之后
  while (*p++ = *src++)
  {
    ;
  }
  return dest;
}

看看效果:

b7960d796587491eb12ae06bb5970719.png

3.3思考

现在我们已经了解了这个函数了,那我们来思考一个问题,使用strcat可不可以实现 字符串自己给自己追加?


这样是不可行的!!!

为啥尼?

因为如果是字符串自己给自己追加,那么目标字符串和源字符串就是同一个字符串了,我们已经知道strcat在进行追加时是会将目标字符串的’\0’覆盖掉的,因为它是从’\0’处开始向后追加,那这样一来,源字符串中就没有’\0’,遇不到’\0’的话指针就会一直向后走,这样肯定会出现问题的。

所以这样的操作是不行的。

060a5cb75fe249c0ba0662020ca2f4f1.png

那有没有什么方法可以实现字符串自己给自己追加呢?

方法是有的,别着急,我们在后面给大家解答!

4.字符串比较函数——strcmp

先来认识一下:

b69298bdb4034710bb7634022511ac44.png

4.1使用及注意事项

注意strcmp在比较字符串的时候不是比较两个字符串的长度,而是比较它们对应位置的字符,一个一个的比较,如果相等就比较下一个,不相等的时候,看两个字符谁大谁小(ASCII码值),返回对应的值。

下面我们来练习一下它的使用:

#include <stdio.h>
#include <string.h>
int main()
{
  char arr[] = "abx";
  char arr2[] = "abcfg";
  printf("%d", strcmp(arr, arr2));
  return 0;
}

arr和arr1进行比较,前两个字符ab都相同,第三对字符arr的’x’大于arr1的’c’,所以arr大于arr1,返回1。

看看结果是不是:

00d67cdda8a64be28ce47ed66f689b6e.png

4.2strcmp 的模拟实现

思路就很明白了,我们就一对一对的比较就行了。

如果两个字符串是一样的,那就一直往后比,直到遇到’\0’停止,返回0。

不一样的话,还是先一直往后比,比到不相同的那一对字符,判断它们的大小关系,返回对应值就行了。

我们来实现一下:

int my_strcmp(const char* s1, const char* s2)
{
  assert(s1 && s2);
  while (*s1 == *s2)
  {
    if (*s1 == '\0')
      return 0;
    s1++;
    s2++;
  }
  if (*s1 > *s2)
    return 1;
  else
    return -1;
}

看看效果:

3b8f28c4ecac4aef9845796b90bbbe3f.png

当然这里我们实现的和strcmp一样,返回的是1,0,-1。

但其实不一定非得是1,-1,因为标准规定只要是大于0,小于0的数字就行了,所以我们还可以简化一下,直接返回*s1 - *s2,这样得到的是它们的ASCII码的差值,也符合要求。

int my_strcmp(const char* s1, const char* s2)
{
  assert(s1 && s2);
  while (*s1 == *s2)
  {
    if (*s1 == '\0')
      return 0;
    s1++;
    s2++;
  }
  return *s1 - *s2;
}

5.小结

学到这里,我们来回顾一下刚才学的几个函数,strcpy、strcat、strcmp,我们会发现,这几个操作字符串的函数跟字符串的长度的是没有关系的,关键在于’\0’:

strcpy拷贝完’\0’就停止拷贝

strcat追加完’\0’就停止追加

strcmp比较完’\0’就停止比较

我们把它叫做长度不受限制的字符串操作函数。


那接下来,我们再来学习一组字符串操作函数,大家对比一下,和上面这几个有什么区别!


目录
相关文章
|
1月前
|
C语言 C++
C语言 之 内存函数
C语言 之 内存函数
35 3
|
12天前
|
C语言
c语言调用的函数的声明
被调用的函数的声明: 一个函数调用另一个函数需具备的条件: 首先被调用的函数必须是已经存在的函数,即头文件中存在或已经定义过; 如果使用库函数,一般应该在本文件开头用#include命令将调用有关库函数时在所需要用到的信息“包含”到本文件中。.h文件是头文件所用的后缀。 如果使用用户自己定义的函数,而且该函数与使用它的函数在同一个文件中,一般还应该在主调函数中对被调用的函数做声明。 如果被调用的函数定义出现在主调函数之前可以不必声明。 如果已在所有函数定义之前,在函数的外部已做了函数声明,则在各个主调函数中不必多所调用的函数在做声明
27 6
|
1月前
|
存储 缓存 C语言
【c语言】简单的算术操作符、输入输出函数
本文介绍了C语言中的算术操作符、赋值操作符、单目操作符以及输入输出函数 `printf` 和 `scanf` 的基本用法。算术操作符包括加、减、乘、除和求余,其中除法和求余运算有特殊规则。赋值操作符用于给变量赋值,并支持复合赋值。单目操作符包括自增自减、正负号和强制类型转换。输入输出函数 `printf` 和 `scanf` 用于格式化输入和输出,支持多种占位符和格式控制。通过示例代码详细解释了这些操作符和函数的使用方法。
36 10
|
25天前
|
存储 算法 程序员
C语言:库函数
C语言的库函数是预定义的函数,用于执行常见的编程任务,如输入输出、字符串处理、数学运算等。使用库函数可以简化编程工作,提高开发效率。C标准库提供了丰富的函数,满足各种需求。
|
1月前
|
机器学习/深度学习 C语言
【c语言】一篇文章搞懂函数递归
本文详细介绍了函数递归的概念、思想及其限制条件,并通过求阶乘、打印整数每一位和求斐波那契数等实例,展示了递归的应用。递归的核心在于将大问题分解为小问题,但需注意递归可能导致效率低下和栈溢出的问题。文章最后总结了递归的优缺点,提醒读者在实际编程中合理使用递归。
60 7
|
1月前
|
存储 编译器 程序员
【c语言】函数
本文介绍了C语言中函数的基本概念,包括库函数和自定义函数的定义、使用及示例。库函数如`printf`和`scanf`,通过包含相应的头文件即可使用。自定义函数需指定返回类型、函数名、形式参数等。文中还探讨了函数的调用、形参与实参的区别、return语句的用法、函数嵌套调用、链式访问以及static关键字对变量和函数的影响,强调了static如何改变变量的生命周期和作用域,以及函数的可见性。
30 4
|
1月前
|
存储 编译器 C语言
C语言函数的定义与函数的声明的区别
C语言中,函数的定义包含函数的实现,即具体执行的代码块;而函数的声明仅描述函数的名称、返回类型和参数列表,用于告知编译器函数的存在,但不包含实现细节。声明通常放在头文件中,定义则在源文件中。
|
28天前
|
存储 C语言
【c语言】字符串函数和内存函数
本文介绍了C语言中常用的字符串函数和内存函数,包括`strlen`、`strcpy`、`strcat`、`strcmp`、`strstr`、`strncpy`、`strncat`、`strncmp`、`strtok`、`memcpy`、`memmove`和`memset`等函数的使用方法及模拟实现。文章详细讲解了每个函数的功能、参数、返回值,并提供了具体的代码示例,帮助读者更好地理解和掌握这些函数的应用。
23 0
|
28天前
|
C语言
【c语言】qsort函数及泛型冒泡排序的模拟实现
本文介绍了C语言中的`qsort`函数及其背后的回调函数概念。`qsort`函数用于对任意类型的数据进行排序,其核心在于通过函数指针调用用户自定义的比较函数。文章还详细讲解了如何实现一个泛型冒泡排序,包括比较函数、交换函数和排序函数的编写,并展示了完整的代码示例。最后,通过实际运行验证了排序的正确性,展示了泛型编程的优势。
20 0
|
1月前
|
算法 C语言
factorial函数c语言
C语言中实现阶乘函数提供了直接循环和递归两种思路,各有优劣。循环实现更适用于大规模数值,避免了栈溢出风险;而递归实现则在代码简洁度上占优,但需警惕深度递归带来的潜在问题。在实际开发中,根据具体需求与环境选择合适的实现方式至关重要。
28 0