这篇文章给大家介绍一些C语言中处理字符串的 库函数 以及它们的使用和注意事项,一起来学习吧!!!
本篇文章介绍的函数需要包含的头文件都是#include
前言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串 中或者 字符数组 中。
字符串常量 适用于那些对它不做修改的字符串函数.
1.求字符串长度——strlen
strlen是库函数,我们要知道库函数的参数和它的功能是C语言标准规定好的,那我们怎么看它的参数是什么呢?
之前的文章里给大家提到过一个查询库函数的网站(cplusplus.com):
链接: link
那我们来看一下C语言标准规定strlen的参数和功能是怎么样的的:
1.1 使用及注意事项
相信这个函数大家以及比较熟悉了,但这里还是带大家一起来复习一下,并强调一些注意事项:
字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’ )。
举个例子:
#include <string.h> #include <stdio.h> int main() { char arr[] = "abcdef"; char arr2[] = { 'a','b','c','d','e','f','\0' }; printf("%d\n", strlen(arr)); printf("%d\n", strlen(arr2)); return 0; }
看下结果:
字符’\0’之前有6个字符,所以结果是6,相信大家都能明白。
参数指向的字符串必须要以 ‘\0’ 结束。
我们知道字符串的结束标志是’\0’,那如果一个字符串中没有’\0’,还能用strlen计算它的长度吗?
int main() { char arr[] = { 'a','b','c','d','e','f' }; char arr2[] = { 'a','b','f'}; printf("%d\n", strlen(arr)); printf("%d\n", strlen(arr2)); return 0; }
大家思考一下结果会是什么?
19和31,为什么会是这个结果,是巧合吗?我们再运行一次:
19和31,为什么会是这个结果,是巧合吗?我们再运行一次:
又一个不同的结果,为啥呢?
因为如果我们不加’\0’,去求一个没有结束标志的字符串,它的结果将会是一个随机值,为什么呢?
因为函数strlen 求的是字符串中’\0’之前的字符个数,但是上面的两个字符串(C语言没有字符串类型,我们放到了字符数组中)中没有’\0’,所以strlen函数就会一直向后寻找,直至遇到’\0’,但数组后面的内存空间放的是什么我们是不知道的,所以我们不知道什么时候会遇到’\0’,因此结果是一个随机值。
注意函数的返回值为size_t,是无符号的( 易错 )
大家可能不是太明白,我们来先看一段代码:
#include <stdio.h> int main() { const char*str1 = "abcdef"; const char*str2 = "bbb"; if(strlen(str2)-strlen(str1)>0) { printf("str2>str1\n"); } else { printf("srt1>str2\n"); } return 0; }
大家思考一下结果是啥?
str1的长度为6,str2的长度为3,所以
strlen(str2)-strlen(str1)
的结果是-3,小于0,if判断为假,所以打印"srt1>str2"
如果你是这样想的那就错了!!!
我们来看一下结果是啥?
结果是str2>str1
,与我们想的不一样,原因就在于函数strlen的返回值为size_t。
解释:
不知道大家有没有注意到,库函数strlen的返回类型是size_t。
那什么是size_t呢?我们来看一下:
怎么看,在vs2022中输入一个size_t,鼠标右键转到定义或直接按F12即可查看:
我们看到,size_t其实就是unsigend int (无符号整型),因为typedef unsigned int size_t的意思其实就是把类型unsigned int 重命名为 size_t。
由于strlen的返回类型是size_t,所以strlen(str2)-strlen(str1)的结果就也是size_t了。
那么3-6=-3,我们知道内存中存的是补码:
那如果11111111111111111111111111111101被当作一个无符号整型,转化为10进制将是一个非常大的正数,肯定大于0,所以结果才是str2>str1。
1.2 strlen的模拟实现
那我们现在已经知道了函数strlen的参数以及它的功能,我们是不是可以尝试去模拟实现一下strlen呢?
这里我们介绍三种方法去模拟实现strlen:
- 计数器方式
怎么实现呢?
把字符串的首字符地址传给函数,用指针接收,用该指针遍历字符串,如果指针指向的内容不是’\0’,计数器++,指针继续向后移动,直至遇到’\0’停止,返回计数器的值。
size_t my_strlen(const char* str) { int count = 0; while (*str) { count++; str++; } return count; }
看一下能不能达到效果:
- 递归实现
怎么递归呢?
我们对传过来的首字符地址直接解引用,如果是’\0’,那就返回0。
如果不是’\0’,那说明至少有一个有效字符,让指针+1,返回
1+my_strlen(str+1)
,直至遇到’\0’,开始回归得出结果。
size_t my_strlen(const char* str) { if (*str == '\0') return 0; else return 1 + my_strlen(str + 1); }
也能得到正确结果:
- 指针-指针
在指针的学习中我们已经知道,指针-指针得到的是两个指针之间的元素个数,那我们让一个指针指向首字符,另一个指针指向’\0’,后者减前者,得到的元素个数不就是字符串长度吗?
size_t my_strlen(char* s) { char* p = s; while (*p != '\0') p++; return p - s; }
这样依然可行:
2.字符串拷贝——strcpy
先来认识一下它吧:
2.1 使用及注意事项
源字符串必须以 ‘\0’ 结束
我们知道字符串的结束标志是’\0’,也就是说,strcpy在拷贝源字符串时,遇到’\0’才会停止拷贝,而跟字符串的长度无关,只要不遇到’\0’,就一直往后继续拷贝,那如果我们的源字符串中没有’\0’,会出现什么后果呢?
int main() { char arr1[20] = { 0 }; char arr2[] = {'a','b','c'}; strcpy(arr1, arr2); return 0; }
将arr2中的字符串拷贝到arr1中,但是arr2中的字符串并没有’\0’,会出现什么样的结果呢?
我们调试可以发现,这样是会发生错误的,因为在字符’a’、‘b’、‘c’的后面并没有放’\0’,所以strcpy会一直向后拷贝,我们不知道什么时候才会遇到’\0’停止下来,而且arr1我们申请的空间也是有限的,也不能无限的向里面放东西,所以这样就有可能造成越界,而且在’a’、‘b’、'c’后面会拷贝什么内容我们也不知道,这是不可行的。
因此,源字符串必须以 ‘\0’ 结束。
会将源字符串中的 ‘\0’ 拷贝到目标空间
strcpy在拷贝的时候会将源字符串的’\0’也拷贝到目标空间
我们来验证一下:
int main() { char arr1[20] = "*****************"; char arr2[] = "abc"; strcpy(arr1, arr2); printf("%s", arr1); return 0; }
- 目标空间必须足够大,以确保能存放源字符串
既然我们要把源字符串拷贝放到目标空间,那一定要确保目标空间足够大,能够放得下源字符串,如果目标空间大小不够,肯定也会出现问题的。
int main() { char arr1[] = "abc"; char arr2[] = "xxxxxx"; strcpy(arr1, arr2); printf("%s", arr1); return 0; }
- 目标空间必须可变
什么意思呢,就是目标空间放的内容必须是可修改的,因为我们要把源字符串的内容拷贝放进目标空间中(相当于修改了目标空间的内容),如果目标空间不可变,那肯定是不行的。
比如:
int main() { char* p = "hello world"; char arr[] = "abc"; strcpy(p, arr); return 0; }
2.2 strcpy的模拟实现
接下来我们来模拟实现一下strcpy,直接上代码:
char* my_strcpy(char* dest, const char* src) { assert(dest && src); char* ret = dest; while (*dest++ = *src++) { ; } return ret; }
解释一下:
看一下效果:
3.字符串追加函数——strcat
一起来认识一下:
其实就是在一个字符串的后面追加上另外一个字符串。追加的字符串从目标字符串(即被追加的字符串)的结束标志’\0’处开始追加(会覆盖目标字符串的’\0’),追加至’\0’停止。
演示一下:
#include <stdio.h> #include <string.h> int main() { char arr1[20] = "hello "; char arr2[] = "world"; strcat(arr1, arr2); printf("%s\n", arr1); return 0; }
看看效果:
3.1使用及注意事项
- 源字符串必须以 ‘\0’ 结束。
因为追加的时候还是遇到’\0’停止,如果源字符串中没有’\0’,就会一直继续向后追加,而后面的空间是不属于我们的,里面放的是什么东西也是未知的,这样肯定会出现问题的。
目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改
跟strcpy一样,要操作的目标空间必须是可变的,因为追加字符串相当于对目标空间做出了修改,所以目标空间必须是可变的,不能是字符串常量。
3.2 strcat的模拟实现
现在我们已经知道了strcat的参数和工作原理,那我们就来模拟实现一下它:
怎么搞呢?
我们知道strcat在追加字符串时是从目标字符串的结束标志’\0’处开始追加的(会覆盖掉目标字符串的’\0’),直至遇到’\0’追加结束,当然源字符串的’\0’也会追加上去。
那我们先用一个指针找到目标字符串的’\0’,然后的操作是不是就跟strcpy一样了啊,把源字符串的内容拷贝到目标字符串的’\0’之后不就行了嘛。
实现一下:
char* my_strcat(char* dest, const char* src) { assert(dest && src); //1.找到目标字符串的'\0' char* p = dest; while (*p != '\0') { p++; } //2.将源字符串拷贝到目标空间的'\0'之后 while (*p++ = *src++) { ; } return dest; }
看看效果:
3.3思考
现在我们已经了解了这个函数了,那我们来思考一个问题,使用strcat可不可以实现 字符串自己给自己追加?
这样是不可行的!!!
为啥尼?
因为如果是字符串自己给自己追加,那么目标字符串和源字符串就是同一个字符串了,我们已经知道strcat在进行追加时是会将目标字符串的’\0’覆盖掉的,因为它是从’\0’处开始向后追加,那这样一来,源字符串中就没有’\0’,遇不到’\0’的话指针就会一直向后走,这样肯定会出现问题的。
所以这样的操作是不行的。
那有没有什么方法可以实现字符串自己给自己追加呢?
方法是有的,别着急,我们在后面给大家解答!
4.字符串比较函数——strcmp
先来认识一下:
4.1使用及注意事项
注意strcmp在比较字符串的时候不是比较两个字符串的长度,而是比较它们对应位置的字符,一个一个的比较,如果相等就比较下一个,不相等的时候,看两个字符谁大谁小(ASCII码值),返回对应的值。
下面我们来练习一下它的使用:
#include <stdio.h> #include <string.h> int main() { char arr[] = "abx"; char arr2[] = "abcfg"; printf("%d", strcmp(arr, arr2)); return 0; }
arr和arr1进行比较,前两个字符ab都相同,第三对字符arr的’x’大于arr1的’c’,所以arr大于arr1,返回1。
看看结果是不是:
4.2strcmp 的模拟实现
思路就很明白了,我们就一对一对的比较就行了。
如果两个字符串是一样的,那就一直往后比,直到遇到’\0’停止,返回0。
不一样的话,还是先一直往后比,比到不相同的那一对字符,判断它们的大小关系,返回对应值就行了。
我们来实现一下:
int my_strcmp(const char* s1, const char* s2) { assert(s1 && s2); while (*s1 == *s2) { if (*s1 == '\0') return 0; s1++; s2++; } if (*s1 > *s2) return 1; else return -1; }
看看效果:
当然这里我们实现的和strcmp一样,返回的是1,0,-1。
但其实不一定非得是1,-1,因为标准规定只要是大于0,小于0的数字就行了,所以我们还可以简化一下,直接返回*s1 - *s2
,这样得到的是它们的ASCII码的差值,也符合要求。
int my_strcmp(const char* s1, const char* s2) { assert(s1 && s2); while (*s1 == *s2) { if (*s1 == '\0') return 0; s1++; s2++; } return *s1 - *s2; }
5.小结
学到这里,我们来回顾一下刚才学的几个函数,strcpy、strcat、strcmp,我们会发现,这几个操作字符串的函数跟字符串的长度的是没有关系的,关键在于’\0’:
strcpy拷贝完’\0’就停止拷贝
strcat追加完’\0’就停止追加
strcmp比较完’\0’就停止比较
我们把它叫做长度不受限制的字符串操作函数。
那接下来,我们再来学习一组字符串操作函数,大家对比一下,和上面这几个有什么区别!