【C进阶】——详解10个C语言中常见的字符串操作函数及其模拟实现(一)

简介: 【C进阶】——详解10个C语言中常见的字符串操作函数及其模拟实现(一)

这篇文章给大家介绍一些C语言中处理字符串的 库函数 以及它们的使用和注意事项,一起来学习吧!!!

本篇文章介绍的函数需要包含的头文件都是#include


前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串 中或者 字符数组 中。

字符串常量 适用于那些对它不做修改的字符串函数.


1.求字符串长度——strlen

strlen是库函数,我们要知道库函数的参数和它的功能是C语言标准规定好的,那我们怎么看它的参数是什么呢?


之前的文章里给大家提到过一个查询库函数的网站(cplusplus.com):

链接: link


那我们来看一下C语言标准规定strlen的参数和功能是怎么样的的:

a8fbcac7312a46779f8cd40a612667fc.png

1.1 使用及注意事项

相信这个函数大家以及比较熟悉了,但这里还是带大家一起来复习一下,并强调一些注意事项:


字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。


举个例子:

#include <string.h>
#include <stdio.h>
int main()
{
  char arr[] = "abcdef";
  char arr2[] = { 'a','b','c','d','e','f','\0' };
  printf("%d\n", strlen(arr));
  printf("%d\n", strlen(arr2));
  return 0;
}

看下结果:

9c9761848c974abb8de22ef3356949b5.png

字符’\0’之前有6个字符,所以结果是6,相信大家都能明白。

参数指向的字符串必须要以 ‘\0’ 结束。

我们知道字符串的结束标志是’\0’,那如果一个字符串中没有’\0’,还能用strlen计算它的长度吗?

int main()
{
  char arr[] = { 'a','b','c','d','e','f' };
  char arr2[] = { 'a','b','f'};
  printf("%d\n", strlen(arr));
  printf("%d\n", strlen(arr2));
  return 0;
}

大家思考一下结果会是什么?

cfa4b9c820174e458c8cf6a6f9a6f6bf.png

19和31,为什么会是这个结果,是巧合吗?我们再运行一次:

2e660ee09e6442c299e9c6a8dfcd8ed9.png

19和31,为什么会是这个结果,是巧合吗?我们再运行一次:

2e660ee09e6442c299e9c6a8dfcd8ed9.png

又一个不同的结果,为啥呢?


因为如果我们不加’\0’,去求一个没有结束标志的字符串,它的结果将会是一个随机值,为什么呢?

因为函数strlen 求的是字符串中’\0’之前的字符个数,但是上面的两个字符串(C语言没有字符串类型,我们放到了字符数组中)中没有’\0’,所以strlen函数就会一直向后寻找,直至遇到’\0’,但数组后面的内存空间放的是什么我们是不知道的,所以我们不知道什么时候会遇到’\0’,因此结果是一个随机值。


注意函数的返回值为size_t,是无符号的( 易错 )


大家可能不是太明白,我们来先看一段代码:

#include <stdio.h>
int main()
{
 const char*str1 = "abcdef";
 const char*str2 = "bbb";
 if(strlen(str2)-strlen(str1)>0)
 {
 printf("str2>str1\n");
 } 
 else
 {
 printf("srt1>str2\n");
 }
 return 0; }

大家思考一下结果是啥?

str1的长度为6,str2的长度为3,所以strlen(str2)-strlen(str1)的结果是-3,小于0,if判断为假,所以打印"srt1>str2"

如果你是这样想的那就错了!!!

我们来看一下结果是啥?

0816b6a7f4744327a241aad4092689af.png

结果是str2>str1,与我们想的不一样,原因就在于函数strlen的返回值为size_t。

解释:9cbcb051de9a46129a49c49cee12f328.png

不知道大家有没有注意到,库函数strlen的返回类型是size_t。

那什么是size_t呢?我们来看一下:

06ef7b3fe9e9400b894bb11642d4ab81.png

怎么看,在vs2022中输入一个size_t,鼠标右键转到定义或直接按F12即可查看:

7e172bfb20a149c698e5a65160f65f8a.png

我们看到,size_t其实就是unsigend int (无符号整型),因为typedef unsigned int size_t的意思其实就是把类型unsigned int 重命名为 size_t。

由于strlen的返回类型是size_t,所以strlen(str2)-strlen(str1)的结果就也是size_t了。

那么3-6=-3,我们知道内存中存的是补码:

a3a7eebec7f0425dba488f22013402cc.png

那如果11111111111111111111111111111101被当作一个无符号整型,转化为10进制将是一个非常大的正数,肯定大于0,所以结果才是str2>str1。


1.2 strlen的模拟实现

那我们现在已经知道了函数strlen的参数以及它的功能,我们是不是可以尝试去模拟实现一下strlen呢?

bb31c2bf839d4e12984b538884b88f13.png

这里我们介绍三种方法去模拟实现strlen:

  1. 计数器方式

怎么实现呢?

把字符串的首字符地址传给函数,用指针接收,用该指针遍历字符串,如果指针指向的内容不是’\0’,计数器++,指针继续向后移动,直至遇到’\0’停止,返回计数器的值。

size_t my_strlen(const char* str) 
{
  int count = 0;
  while (*str)
  {
    count++;
    str++;
  }
  return count;
}

看一下能不能达到效果:

070ce5becec6410ab71e0a67e925ae51.png

  1. 递归实现

怎么递归呢?

我们对传过来的首字符地址直接解引用,如果是’\0’,那就返回0。

如果不是’\0’,那说明至少有一个有效字符,让指针+1,返回1+my_strlen(str+1),直至遇到’\0’,开始回归得出结果。

size_t my_strlen(const char* str) 
{
  if (*str == '\0')
    return 0;
  else
    return 1 + my_strlen(str + 1);
}

也能得到正确结果:3143976073174ff5a4324c4fccc64478.png

  1. 指针-指针

在指针的学习中我们已经知道,指针-指针得到的是两个指针之间的元素个数,那我们让一个指针指向首字符,另一个指针指向’\0’,后者减前者,得到的元素个数不就是字符串长度吗?

size_t my_strlen(char* s) 
{
  char* p = s;
  while (*p != '\0')
    p++;
  return p - s;
}

这样依然可行:

e158d9c17dfa448da304133d2db6f6e2.png

2.字符串拷贝——strcpy

先来认识一下它吧:

2bd6be376ab74e128e053501f521162e.png

2.1 使用及注意事项

源字符串必须以 ‘\0’ 结束

我们知道字符串的结束标志是’\0’,也就是说,strcpy在拷贝源字符串时,遇到’\0’才会停止拷贝,而跟字符串的长度无关,只要不遇到’\0’,就一直往后继续拷贝,那如果我们的源字符串中没有’\0’,会出现什么后果呢?

int main()
{
  char arr1[20] = { 0 };
  char arr2[] = {'a','b','c'};
  strcpy(arr1, arr2);
  return 0;
}

将arr2中的字符串拷贝到arr1中,但是arr2中的字符串并没有’\0’,会出现什么样的结果呢?

062958b0fa3a47bb906c68cf512026a1.png

我们调试可以发现,这样是会发生错误的,因为在字符’a’、‘b’、‘c’的后面并没有放’\0’,所以strcpy会一直向后拷贝,我们不知道什么时候才会遇到’\0’停止下来,而且arr1我们申请的空间也是有限的,也不能无限的向里面放东西,所以这样就有可能造成越界,而且在’a’、‘b’、'c’后面会拷贝什么内容我们也不知道,这是不可行的。

因此,源字符串必须以 ‘\0’ 结束。


会将源字符串中的 ‘\0’ 拷贝到目标空间

strcpy在拷贝的时候会将源字符串的’\0’也拷贝到目标空间


我们来验证一下:

int main()
{
  char arr1[20] = "*****************";
  char arr2[] = "abc";
  strcpy(arr1, arr2);
  printf("%s", arr1);
  return 0;
}

8d1de1ad54124224ac309e070f58fc05.png

  1. 目标空间必须足够大,以确保能存放源字符串

既然我们要把源字符串拷贝放到目标空间,那一定要确保目标空间足够大,能够放得下源字符串,如果目标空间大小不够,肯定也会出现问题的。

int main()
{
  char arr1[] = "abc";
  char arr2[] = "xxxxxx";
  strcpy(arr1, arr2);
  printf("%s", arr1);
  return 0;
}

04c90367ae054272804eda77e875441e.png

  1. 目标空间必须可变

什么意思呢,就是目标空间放的内容必须是可修改的,因为我们要把源字符串的内容拷贝放进目标空间中(相当于修改了目标空间的内容),如果目标空间不可变,那肯定是不行的。

比如:

int main()
{
  char* p = "hello world";
  char arr[] = "abc";
  strcpy(p, arr);
  return 0;
}

f0ba18632e8b435b883839ca7b1d8a48.png

2.2 strcpy的模拟实现

接下来我们来模拟实现一下strcpy,直接上代码:

char* my_strcpy(char* dest, const char* src)
{
  assert(dest && src);
  char* ret = dest;
  while (*dest++ = *src++)
  {
    ;
  }
  return ret;
}

解释一下:

338f04a62fe442038ea6a3d09fd60ce4.png

看一下效果:

e5cd838a15624ec8bf22c030728d2530.png

3.字符串追加函数——strcat

一起来认识一下:

845e10c3d5db477d8f7f5e849a476e8e.png

6c178570e448484588a326c9da2e10a7.png

其实就是在一个字符串的后面追加上另外一个字符串。追加的字符串从目标字符串(即被追加的字符串)的结束标志’\0’处开始追加(会覆盖目标字符串的’\0’),追加至’\0’停止。

演示一下:

#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = "hello ";
  char arr2[] = "world";
  strcat(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

看看效果:

4ed6b2f648a84dbcb75f8a304b7cc5d7.png

3.1使用及注意事项

  1. 源字符串必须以 ‘\0’ 结束。

因为追加的时候还是遇到’\0’停止,如果源字符串中没有’\0’,就会一直继续向后追加,而后面的空间是不属于我们的,里面放的是什么东西也是未知的,这样肯定会出现问题的。

0f0da0cb88214657bdf6fa150cce2582.png

目标空间必须有足够的大,能容纳下源字符串的内容。

32738968d3ab4065affbfc4d64573e54.png

  1. 目标空间必须可修改

跟strcpy一样,要操作的目标空间必须是可变的,因为追加字符串相当于对目标空间做出了修改,所以目标空间必须是可变的,不能是字符串常量。

bbea755f685d40bab8ad1e463aa81184.png

3.2 strcat的模拟实现

现在我们已经知道了strcat的参数和工作原理,那我们就来模拟实现一下它:


怎么搞呢?

我们知道strcat在追加字符串时是从目标字符串的结束标志’\0’处开始追加的(会覆盖掉目标字符串的’\0’),直至遇到’\0’追加结束,当然源字符串的’\0’也会追加上去。


那我们先用一个指针找到目标字符串的’\0’,然后的操作是不是就跟strcpy一样了啊,把源字符串的内容拷贝到目标字符串的’\0’之后不就行了嘛。


实现一下:

char* my_strcat(char* dest, const char* src)
{
  assert(dest && src);
  //1.找到目标字符串的'\0'
  char* p = dest;
  while (*p != '\0')
  {
    p++;
  }
  //2.将源字符串拷贝到目标空间的'\0'之后
  while (*p++ = *src++)
  {
    ;
  }
  return dest;
}

看看效果:

b7960d796587491eb12ae06bb5970719.png

3.3思考

现在我们已经了解了这个函数了,那我们来思考一个问题,使用strcat可不可以实现 字符串自己给自己追加?


这样是不可行的!!!

为啥尼?

因为如果是字符串自己给自己追加,那么目标字符串和源字符串就是同一个字符串了,我们已经知道strcat在进行追加时是会将目标字符串的’\0’覆盖掉的,因为它是从’\0’处开始向后追加,那这样一来,源字符串中就没有’\0’,遇不到’\0’的话指针就会一直向后走,这样肯定会出现问题的。

所以这样的操作是不行的。

060a5cb75fe249c0ba0662020ca2f4f1.png

那有没有什么方法可以实现字符串自己给自己追加呢?

方法是有的,别着急,我们在后面给大家解答!

4.字符串比较函数——strcmp

先来认识一下:

b69298bdb4034710bb7634022511ac44.png

4.1使用及注意事项

注意strcmp在比较字符串的时候不是比较两个字符串的长度,而是比较它们对应位置的字符,一个一个的比较,如果相等就比较下一个,不相等的时候,看两个字符谁大谁小(ASCII码值),返回对应的值。

下面我们来练习一下它的使用:

#include <stdio.h>
#include <string.h>
int main()
{
  char arr[] = "abx";
  char arr2[] = "abcfg";
  printf("%d", strcmp(arr, arr2));
  return 0;
}

arr和arr1进行比较,前两个字符ab都相同,第三对字符arr的’x’大于arr1的’c’,所以arr大于arr1,返回1。

看看结果是不是:

00d67cdda8a64be28ce47ed66f689b6e.png

4.2strcmp 的模拟实现

思路就很明白了,我们就一对一对的比较就行了。

如果两个字符串是一样的,那就一直往后比,直到遇到’\0’停止,返回0。

不一样的话,还是先一直往后比,比到不相同的那一对字符,判断它们的大小关系,返回对应值就行了。

我们来实现一下:

int my_strcmp(const char* s1, const char* s2)
{
  assert(s1 && s2);
  while (*s1 == *s2)
  {
    if (*s1 == '\0')
      return 0;
    s1++;
    s2++;
  }
  if (*s1 > *s2)
    return 1;
  else
    return -1;
}

看看效果:

3b8f28c4ecac4aef9845796b90bbbe3f.png

当然这里我们实现的和strcmp一样,返回的是1,0,-1。

但其实不一定非得是1,-1,因为标准规定只要是大于0,小于0的数字就行了,所以我们还可以简化一下,直接返回*s1 - *s2,这样得到的是它们的ASCII码的差值,也符合要求。

int my_strcmp(const char* s1, const char* s2)
{
  assert(s1 && s2);
  while (*s1 == *s2)
  {
    if (*s1 == '\0')
      return 0;
    s1++;
    s2++;
  }
  return *s1 - *s2;
}

5.小结

学到这里,我们来回顾一下刚才学的几个函数,strcpy、strcat、strcmp,我们会发现,这几个操作字符串的函数跟字符串的长度的是没有关系的,关键在于’\0’:

strcpy拷贝完’\0’就停止拷贝

strcat追加完’\0’就停止追加

strcmp比较完’\0’就停止比较

我们把它叫做长度不受限制的字符串操作函数。


那接下来,我们再来学习一组字符串操作函数,大家对比一下,和上面这几个有什么区别!


目录
相关文章
|
26天前
|
存储 C语言 开发者
【C语言】字符串操作函数详解
这些字符串操作函数在C语言中提供了强大的功能,帮助开发者有效地处理字符串数据。通过对每个函数的详细讲解、示例代码和表格说明,可以更好地理解如何使用这些函数进行各种字符串操作。如果在实际编程中遇到特定的字符串处理需求,可以参考这些函数和示例,灵活运用。
55 10
|
26天前
|
存储 程序员 C语言
【C语言】文件操作函数详解
C语言提供了一组标准库函数来处理文件操作,这些函数定义在 `<stdio.h>` 头文件中。文件操作包括文件的打开、读写、关闭以及文件属性的查询等。以下是常用文件操作函数的详细讲解,包括函数原型、参数说明、返回值说明、示例代码和表格汇总。
44 9
|
26天前
|
存储 Unix Serverless
【C语言】常用函数汇总表
本文总结了C语言中常用的函数,涵盖输入/输出、字符串操作、内存管理、数学运算、时间处理、文件操作及布尔类型等多个方面。每类函数均以表格形式列出其功能和使用示例,便于快速查阅和学习。通过综合示例代码,展示了这些函数的实际应用,帮助读者更好地理解和掌握C语言的基本功能和标准库函数的使用方法。感谢阅读,希望对你有所帮助!
37 8
|
26天前
|
C语言 开发者
【C语言】数学函数详解
在C语言中,数学函数是由标准库 `math.h` 提供的。使用这些函数时,需要包含 `#include <math.h>` 头文件。以下是一些常用的数学函数的详细讲解,包括函数原型、参数说明、返回值说明以及示例代码和表格汇总。
44 6
|
26天前
|
存储 C语言
【C语言】输入/输出函数详解
在C语言中,输入/输出操作是通过标准库函数来实现的。这些函数分为两类:标准输入输出函数和文件输入输出函数。
183 6
|
26天前
|
存储 缓存 算法
【C语言】内存管理函数详细讲解
在C语言编程中,内存管理是至关重要的。动态内存分配函数允许程序在运行时请求和释放内存,这对于处理不确定大小的数据结构至关重要。以下是C语言内存管理函数的详细讲解,包括每个函数的功能、标准格式、示例代码、代码解释及其输出。
58 6
|
26天前
|
C语言 开发者
【C语言】断言函数 -《深入解析C语言调试利器 !》
断言(assert)是一种调试工具,用于在程序运行时检查某些条件是否成立。如果条件不成立,断言会触发错误,并通常会终止程序的执行。断言有助于在开发和测试阶段捕捉逻辑错误。
37 5
|
29天前
|
存储 算法 C语言
C语言中常见的字符串处理技巧,包括字符串的定义、初始化、输入输出、长度计算、比较、查找与替换、拼接、截取、转换、遍历及注意事项
本文深入探讨了C语言中常见的字符串处理技巧,包括字符串的定义、初始化、输入输出、长度计算、比较、查找与替换、拼接、截取、转换、遍历及注意事项,并通过案例分析展示了实际应用,旨在帮助读者提高编程效率和代码质量。
90 4
|
1月前
|
存储 人工智能 算法
数据结构实验之C 语言的函数数组指针结构体知识
本实验旨在复习C语言中的函数、数组、指针、结构体与共用体等核心概念,并通过具体编程任务加深理解。任务包括输出100以内所有素数、逆序排列一维数组、查找二维数组中的鞍点、利用指针输出二维数组元素,以及使用结构体和共用体处理教师与学生信息。每个任务不仅强化了基本语法的应用,还涉及到了算法逻辑的设计与优化。实验结果显示,学生能够有效掌握并运用这些知识完成指定任务。
60 4
|
1月前
|
C语言
c语言调用的函数的声明
被调用的函数的声明: 一个函数调用另一个函数需具备的条件: 首先被调用的函数必须是已经存在的函数,即头文件中存在或已经定义过; 如果使用库函数,一般应该在本文件开头用#include命令将调用有关库函数时在所需要用到的信息“包含”到本文件中。.h文件是头文件所用的后缀。 如果使用用户自己定义的函数,而且该函数与使用它的函数在同一个文件中,一般还应该在主调函数中对被调用的函数做声明。 如果被调用的函数定义出现在主调函数之前可以不必声明。 如果已在所有函数定义之前,在函数的外部已做了函数声明,则在各个主调函数中不必多所调用的函数在做声明
38 6