重点介绍处理字符和字符串的库函数的使用和注意事项。
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。字符串常量适用于那些对它不做修改的字符串函数。
一、求字符串长度⚪strlen
- 字符串以 '\0' 作为结束标志,strlen 函数返回的是在字符串中 '\0' 前面出现的字符个数(不包含 '\0' )。
- 参数指向的字符串必须要以 '\0' 结束。
- (易错点):注意函数的返回值为 size_t,是无符号(unsigned)的。
⚪【模拟实现】(三种不同方法)
#include <stdio.h> // 1、计数器方式 size_t my_strlen(const char* str) { size_t count = 0; while (*str) { count++; str++; } return count; } // 2、不能创建临时变量计数器 size_t my_strlen(const char* str) { if(*str == '\0') { return 0; } else { return 1 + my_strlen(str+1); } } // 3、指针-指针的方式 size_t my_strlen(char* str) { char *p = str; while(*p != '\0' ) { p++; } return p-str; } int main() { char arr[] = "hello world"; size_t count = my_strlen(arr); printf("%zu\n", count); return 0; }
二、长度不受限制的字符串函数
1、strcpy
Copies the C string pointed by source into the array pointed by destination, including the terminating null character (and stopping at that point).
- 源字符串 src 必须以 '\0' 结束。
- 会将源字符串 src 中的 '\0' 拷贝到目标空间 dest。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变,即目标空间 dest 不可以被 const 声明。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> char* my_strcpy(char* str2, const char* str1) { assert(str1 && str2); char* ret = str2; while (*str2++ = *str1++) { ; } return ret; } int main() { char s1[] = "hello world"; char s2[20] = { 0 }; char* ret = my_strcpy(s2, s1); printf("%s\n", ret); return 0; }
2、strcat
Appends a copy of the source string to the destination string. The terminating null character in destination is overwritten by the fifirst character of source, and a null-character is included at the end of the new string formed by the concatenation of both in destination.
- 源字符串 src 必须以 '\0' 结束。
- 将源字符串 src 中的 '\0' 一同拷贝到目标空间 dest ,并删除 *dest 原来末尾的 '\0'。
- 目标空间必须有足够大,能容纳下源字符串的内容。
- 目标空间必须可修改,即目标空间 dest 不可以被 const 声明。
strcat - C++ Reference (cplusplus.com)
🔺字符串自己给自己追加,会如何?
当使用 strcat 函数将一个字符串追加到自身时,可能会导致未定义的行为。strcat 函数的工作原理是在源字符串的结尾处追加目标字符串的内容,并在结尾加上空字符 '\0'。当源字符串和目标字符串是同一个字符串时,追加操作会导致源字符串的内容被破坏,因为在追加过程中,源字符串的内容会被覆盖,最终结果会是一个不可预测的字符串。因为根据不同的编译器和库的版本,strcat 函数在某些情况下可能不会导致未定义行为。但是将一个字符串追加到自身仍然是一个不好的编程实践,因为它容易引发错误和混乱。
因此,不推荐使用 strcat 函数将字符串追加到自身。如果需要将一个字符串复制到另一个字符串末尾,可以使用 strcpy 函数进行复制操作。
【模拟实现】
#include <stdio.h> #include <assert.h> char* my_strcat(char* dest, const char* src) { char* tmp = dest; assert(dest && src); while (*dest) { dest++; } while (*dest = *src) { dest++; src++; } return tmp; } int main() { char s1[20] = "hello"; char s2[] = " world"; char* ret = my_strcat(s1, s2); printf("%s\n", ret); return 0; }
3、strcmp
This function starts comparing the fifirst character of each string. If they are equal to each other, it continues with the following pairs until the characters diffffer or until a terminating null-character is reached.
⚪标准规定:
- 第一个字符串大于第二个字符串,则返回大于 0 的数字。
- 第一个字符串等于第二个字符串,则返回 0。
- 第一个字符串小于第二个字符串,则返回小于 0 的数字。
strcmp - C++ Reference (cplusplus.com)
🔺那么如何判断两个字符串?
返回值只需要满足要求即可,比如大于 0 的数字,不一定是1,只需满足条件即可。
strcmp 函数的比较是基于字符的 ASCII 码进行的。它从两个字符串的第一个字符开始逐个比较,直至找到不相等的字符或者其中一个字符串的结束符 '\0'。在比较的时候,它会将两个字符的 ASCII 码进行减法运算,返回结果作为比较的结果。
需要注意的是,strcmp 函数是区分大小写的。也就是说,大写字母和小写字母被认为是不同的字符。如果需要不区分大小写的字符串比较,可以使用 strcasecmp 函数(在某些编程环境中可能被称为_stricmp)。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> int my_strcmp(const char* str1, const char* str2) { assert(str1 && str2); while (*str1 == *str2) { if (*str1 == '\0') { return 0; } str1++; str2++; } return (*str1 - *str2); } int main() { char s1[] = "abcdef"; char s2[] = "abcq"; int ret = my_strcmp(s1, s2); if (ret > 0) { printf(">\n"); } else if (ret == 0) { printf("=\n"); } else { printf("<\n"); } return 0; }
⚠ 注意:根据编译器的不同,返回的结果也不同。
在 VS2019 中,大于返回 1,等于返回 0,小于返回 -1。但在 Linux-gcc 中,大于返回正数,等于返回0,小于返回负数。
// 推荐 if(strcmp(p1, p2) > 0) { printf("p1 > p2"); } else if(strcmp(p1, p2 == 0)) { printf("p1 == p2"); } else if(strcmp(p1, p2) < -1) { printf("p1 < p2"); } // 不推荐 if(strcmp(p1, p2) == 1) { printf("p1 > p2"); } else if(strcmp(p1, p2 == 0)) { printf("p1 == p2"); } else if(strcmp(p1, p2) == -1) { printf("p1 < p2"); }
三、长度受限制的字符串函数介绍
1、strncpy
Copies the fifirst num characters of source to destination. If the end of the source C string (which is signaled by a null-character) is found before num characters have been copied, destination is padded with zeros until a total of num characters have been written to it.
- 拷贝 count 个字符从源字符串到目标空间。
- 如果源字符串的长度小于 count,则拷贝完源字符串之后,在目标的后边追加 0,直到 count 个。
- dest 和 src 不应该重叠(重叠时可以用更安全的 memmove 替代)。
- 目标空间 dest 必须足够大,以确保能够存放源字符串。
- 目标空间 dest 必须可变,即目标空间 dest 不可以被 const 声明。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> char* my_strncpy(char* dest, const char* src, size_t count) { assert(dest && src); char* cur = dest; while (count--) { if ((*dest++ = *src++) == '\0') { break; } } if (count != 0) { while (count--) { *dest++ = '\0'; } } return cur; } int main() { char s1[20] = { 0 }; char s2[] = "hello world"; int sz = sizeof(s2) / sizeof(s2[0]); printf("%s\n", my_strncpy(s1, s2, sz)); return 0; }
2、strncat
Appends the fifirst num characters of source to destination, plus a terminating null-character. If the length of the C string in source is less than num, only the content up to the terminating null-character is copied.
- 如果源字符串的长度小于 count,则只复制 '\0' 之前的内容。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> char* my_strncat(char* dest, const char* src, size_t count) { assert(dest && src); char* cur = dest; while (*dest) { dest++; } while (count--) { if ((*dest++ = *src++) == '\0') { return cur; } } *dest = '\0'; return cur; } int main() { char s1[20] = "hello"; char s2[] = " world"; size_t sz = sizeof(s2) / sizeof(s2[0]); printf("%s\n", my_strncat(s1, s2, sz)); // 从s2中取sz个追加到s1中 return 0; }
3、strncmp
【代码演示】
#include <stdio.h> #include <string.h> int main() { const char* p1 = "abczdef"; const char* p2 = "abcqwer"; int ret1 = strncmp(p1, p2, 1); int ret2 = strncmp(p1, p2, 4); printf("%d %d\n", ret1, ret2); return 0; }
四、字符串查找
1、strstr
Returns a pointer to the fifirst occurrence of str2 in str1, or a null pointer if str2 is not part of str1.
- 返回字符串中首次出现子串的地址。若 str2 是 str1 的子串,则返回 str2 在 str1 中首次出现的地址。如果 str2 不是 str1 的子串,则返回 NULL 。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> char* my_strstr(const char* str1, const char* str2) { assert(str1 && str2); if (*str2 == '\0') { return (char*)str1; } char* cur = (char*)str1; char* s1, *s2; while (*cur != '\0') { s1 = cur; s2 = (char*)str2; while (*s1 && *s2 && (*s1 == *s2)) { s1++; s2++; } if (*s2 == '\0') { return cur; } cur++; } return NULL; } int main() { char s1[] = "abbcde"; char s2[] = "bcd"; char s3[] = "abcd"; char* ret1 = my_strstr(s1, s2); char* ret2 = my_strstr(s1, s3); if (ret1 == NULL) { printf("未找到匹配的子串!\n"); } else { printf("%s\n", ret1); } if (ret2 == NULL) { printf("未找到匹配的子串!\n"); } else { printf("%s\n", ret2); } return 0; }
2、strtok
- sep(delimit) 参数是个字符串,定义了用作分隔符的字符集合。
- 第一个参数指定一个字符串,它包含了 0 个或者多个由 sep 字符串中一个或者多个分隔符分割的标记。
- strtok 函数找到 str 中的下一个标记,并将其用 '\0' 结尾,返回一个指向这个标记的指针。(注:strtok 函数会改变被操作的字符串,所以在使用 strtok 函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok 函数的第一个参数不为 NULL ,函数将找到 str 中第一个标记,strtok 函数将保存它在字符串中的位置。
- strtok 函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
strtok - C++ Reference (cplusplus.com)
⚠ 注意:strtok 会破坏原字符串,分割后原字符串保留第一个分割符前的字符。
【代码演示】
#include <stdio.h> #include <string.h> int main() { char arr[] = "3031899646@qq.com"; printf("原字符串: %s\n", arr); const char* sep = "@."; // 创建sep char arr1[30]; char* ret = NULL; strcpy(arr1, arr); // 将数据拷贝一份,保留arr数组的内容 // 分行打印切割内容 for (ret = strtok(arr, sep); ret != NULL; ret = strtok(NULL, sep)) { printf("%s\n", ret); } printf("分割后原字符串被破坏: %s\n", arr); // 分割后原字符串保留第一个分割符前的字符 return 0; }
五、错误信息报告⚪strerror
- 返回错误码,所对应的错误信息。
- errno 是一个全局的错误码变量。当 C 语言的库函数在执行过程中,发生了错误后就会把对应的错误码赋值到errno中。
⚪【模拟实现】
#include <stdio.h> #include <string.h> #include <errno.h> // 错误码 错误信息 // 0 - No error // 1 - Operation not permitted // 2 - No such file or directory // int main() { char* str = strerror(errno); printf("%s\n", str); return 0; }
六、字符操作
1、字符分类函数
⚪【代码演示】
#include <stdio.h> #include <ctype.h> int main() { char ch1 = 'a'; int ret = islower(ch1); // 判断ch1是否为小写 -- 非0为真 printf("%d\n", ret); char ch2 = 'B'; int res = islower(ch2); // 判断ch2是否为小写 -- 0为假 printf("%d\n", res); return 0; }
⚠ 注意:需引入头文件 ctype.h 头文件。
2、字符转换
int tolower ( int c ); int toupper ( int c );
⚪【代码演示】
#include <stdio.h> int main() { char ch = tolower('Q'); // 大写转小写 putchar(ch); return 0; }
七、内存操作函数
1、memcpy
- 函数 memcpy 从 src 的位置开始向后复制 count 个字节的数据到 dest 的内存位置。
- 这个函数在遇到 '\0' 的时候并不会停下来。
- 如果 src 和 dest 有任何的重叠,复制的结果都是未定义的。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> void* my_memcpy(void* dest, const void* src, size_t count) { assert(dest && src); void* ret = dest; while (count--) { *(char*)dest = *(char*)src; dest = (char*)dest + 1; src = (char*)src + 1; } return ret; } int main() { char s1[] = "abcdefgh"; char s2[20] = "xxxxxxxxxx"; my_memcpy(s2, s1, 5); printf("%s\n", s2); return 0; }
⚪【代码演示】
// 拷贝结构体 #include <stdio.h> #include <string.h> struct S { char name[20]; int age; }; int main() { struct S arr3[] = { {"张三", 20}, {"李四", 30} }; struct S arr4[3] = { 0 }; memcpy(arr4, arr3, sizeof(arr3)); return 0; }
2、memmove
- 和 memcpy 的差别就是 memmove 函数处理的源内存块和目标内存块是可以重叠的。
- 如果源空间和目标空间出现重叠,就得使用 memmove 函数处理。
C语言标准要求:
memcpy 用来处理不重叠的内存拷贝,而 memmove 用来处理重叠内存的拷贝。
⚪【模拟实现】
#include <stdio.h> #include <assert.h> void* my_memmove(void* dest, const void* src, size_t count) { assert(dest && src); void* ret = dest; //从前->后 if (dest <= src) { while (count--) { *(char*)dest = *(char*)src; dest = (char*)dest + 1; src = (char*)src + 1; } } //从后->前 else { dest = (char*)dest + count - 1; src = (char*)src + count - 1; while (count--) { *(char*)dest = *(char*)src; dest = (char*)dest - 1; src = (char*)src - 1; } } return ret; } int main() { char arr[] = "abcdefgh"; my_memmove(arr, arr + 3, 2); printf("%s\n", arr); return 0; }
3、memset
⚪【代码实现】
#include <stdio.h> #include <string.h> int main() { int arr[10] = { 0 }; memset(arr, 1, 20); // 将前20个字节全部设置为1 return 0; }
4、memcmp
- 比较从 buf1 和 buf2 指针开始的 count 个字节。
⚠ 注意:memcmp 不同于 strcmp,memcmp 遇到 '\0' 不会停止比较。
⚪【代码演示】
#include <stdio.h> #include <string.h> int main() { float arr1[] = { 1.0, 2.0, 3.0, 4.0 }; float arr2[] = { 1.0, 3.0 }; int ret = memcmp(arr1, arr2, 8); // arr1是否比arr2大,比较8个字节 printf("%d\n", ret); return 0; }