1. 前言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串或者字符数组中;字符串常量适用于那些对它不做修改的字符串函数。
2. 函数介绍
2.1 strlen
size_t strlen(const char* str);
- 字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’)。
- 参数指向的字符串必须要以 ‘\0’ 结束。
- 注意函数的返回值为size_t,是无符号的。(易错)
#include <stdio.h> #include <string.h> int main() { if (strlen("abc") - strlen("abcdef") > 0) { printf("大于\n"); } else { printf("小于等于\n"); } return 0; }
以上代码的结果是大于,这就是因为strlen返回的是无符号的整型,所以应该这样写:
#include <stdio.h> #include <string.h> int main() { if ((int)strlen("abc") - (int)strlen("abcdef") > 0) { printf("大于\n"); } else { printf("小于等于\n"); } return 0; }
#include <stdio.h> #include <string.h> int main() { if (strlen("abc") > strlen("abcdef")) { printf("大于\n"); } else { printf("小于等于\n"); } return 0; }
以上两个代码的结果就是小于等于。
我们再来复习一下strlen函数的模拟实现:
#include <stdio.h> //1. 计数器 size_t my_strlen(const char* str) { int count = 0; while (*str != '\0') { count++; str++; } return count; } //2. 指针-指针 //3. 递归的方法 int main() { size_t sz = my_strlen("abc"); printf("%u\n", sz);//3 return 0; }
另外两种方法如果不清楚,可以看之前的指针初阶(1)。
2.2 strcpy
char* strcpy(char* destination, const char* source);
- Copies the C string pointed by source into the array pointed by destination, including the terminating null character (and stopping at that point).
- 源字符串必须以 ‘\0’ 结束。
- 会将源字符串中的 ‘\0’ 拷贝到目标空间。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变。
#include <stdio.h> #include <string.h> int main() { char arr1[20] = { 0 }; //char* arr1 = "xxxxxxxxxx";//err 常量字符串不能被修改 //char arr2[] = "hello bit"; char arr2[6] = { 'a', 'b', 'c', 'd', 'e', '\0' }; strcpy(arr1, arr2); printf("%s\n", arr1);//abcde return 0; }
我们再来看一下strcpy函数的模拟实现:
#include <stdio.h> #include <assert.h> //char* my_strcpy(char* dest, const char* src) //{ // char* ret = dest; // assert(dest != NULL); // assert(src != NULL); // // while (*src != '\0') // { // *dest = *src; // dest++; // src++; // } // // *dest = *src;//\0 // // return ret; //} char* my_strcpy(char* dest, const char* src) { char* ret = dest; assert(dest != NULL); assert(src != NULL); while (*dest++ = *src++) { ; } return ret; } int main() { char arr1[20] = "hello world"; char arr2[] = "xxxxx"; //printf("%s\n", my_strcpy(arr1, arr2)); my_strcpy(arr1 + 6, arr2); printf("%s\n", arr1);//hello xxxxx return 0; }
2.3 strcat
char* strcat(char* destination, const char* source);
- Appends a copy of the source string to the destination string. The terminating null character in destination is overwritten by the first character of source, and a null-character is included at the end of the new string formed by the concatenation of both in destination.
- 源字符串必须以 ‘\0’ 结束。
- 目标字符串也必须以 ‘\0’ 结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
#include <stdio.h> #include <string.h> int main() { char arr1[20] = "hello"; char arr2[] = "world"; strcat(arr1, arr2); printf("%s\n", arr1);//helloworld return 0; }
以下是对strcat函数的模拟实现:
#include <stdio.h> #include <assert.h> char* my_strcat(char* dest, const char* src) { assert(dest && src); char* ret = dest; //1. 找目标空间中的\0 while (*dest) { dest++; } while (*dest++ = *src++) { ; } return ret; } int main() { char arr1[20] = "hello "; char arr2[] = "world"; my_strcat(arr1, arr2); printf("%s\n", arr1);//hello world return 0; }
我们思考一个问题:字符串能自己给自己追加吗?
答:strcat 最好不要自己给自己追加!
#include <stdio.h> #include <assert.h> char* my_strcat(char* dest, const char* src) { assert(dest && src); char* ret = dest; //1. 找目标空间中的\0 while (*dest) { dest++; } while (*dest++ = *src++) { ; } return ret; } int main() { char arr1[20] = "hello"; my_strcat(arr1, arr1); printf("%s\n", arr1); return 0; }
dest 和 src 中一开始存的都是 ‘h’ 的地址,之后 dest 会找到 ‘\0’ 的地址,接着通过 *dest = *src,把 ‘\0’ 替换成 ‘h’,但是这样之后 src 就找不到 ‘\0’ 了,就会进入死循环。因此,strcat 最好不要自己给自己追加!
2.4 strcmp
int strcmp(const char* str1, const char* str2);
- This function starts comparing the first character of each string. If they are equal to each other, it continues with the following pairs until the characters differ or until a terminating null-character is reached.
- 标准规定:
- 第一个字符串大于第二个字符串,则返回大于0的数字
- 第一个字符串等于第二个字符串,则返回0
- 第一个字符串小于第二个字符串,则返回小于0的数字
//VS //> 1 //= 0 //< -1 #include <stdio.h> #include <string.h> int main() { int ret = strcmp("abcdef", "abq"); printf("%d\n", ret);//-1 return 0; }
strcmp的模拟实现:
#include <stdio.h> #include <assert.h> //int my_strcmp(const char* str1, const char* str2) //{ // assert(str1 && str2); // // while (*str1 == *str2) // { // if ('\0' == *str1) // { // return 0; // } // // str1++; // str2++; // } // // if (*str1 > *str2) // { // return 1; // } // else // { // return -1; // } // //} int my_strcmp(const char* str1, const char* str2) { assert(str1 && str2); while (*str1 == *str2) { if ('\0' == *str1) { return 0; } str1++; str2++; } return (*str1 - *str2); } int main() { int ret = my_strcmp("bbq", "bcq"); if (ret > 0) { printf(">\n"); } printf("%d\n", ret);//-1 return 0; }
2.5 strncpy
char* strncpy(char* destination, const char* source, size_t num);
- Copies the first num characters of source to destination. If the end of the source C string (which is signaled by a null-character) is found before num characters have been copied,destination is padded with zeros until a total of num characters have been written to it.
- 拷贝num个字符从源字符串到目标空间。
- 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
#include <stdio.h> #include <string.h> int main() { char arr1[20] = "abcdef"; //char arr2[] = "xxxxxxxxxxxxx"; //strncpy(arr1, arr2, 3); //printf("%s\n", arr1);//xxxdef char arr2[] = "xxx"; strncpy(arr1, arr2, 5); printf("%s\n", arr1);//xxx return 0; }
2.6 strncat
char* strncat(char* destination, const char* source, size_t num);
- Appends the first num characters of source to destination, plus a terminating null-character.
- If the length of the C string in source is less than num, only the content up to the terminating null-character is copied.
#include <stdio.h> #include <string.h> int main() { char arr1[20] = "abcdef\0yyyyyyyyyyy"; char arr2[] = "xxx"; strncat(arr1, arr2, 5); return 0; }
#include <stdio.h> #include <string.h> int main() { char arr1[20] = "abcdef\0yyyyyyyyyyy"; char arr2[] = "xxxxxxxxx"; strncat(arr1, arr2, 3); return 0; }
2.7 strncmp
int strncmp(const char* str1, const char* str2, size_t num);
- 比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。
#include <stdio.h> #include <string.h> int main() { char arr1[] = "abcqwertyuiop"; char arr2[] = "abcdef"; printf("%d\n", strncmp(arr1, arr2, 3));//0 return 0; }
2.8 strstr
char* strstr(const char* str1, const char* str2);
- Returns a pointer to the first occurrence of str2 in str1, or a null pointer if str2 is not part of str1.
//strstr - 字符串中找子字符串 #include <stdio.h> #include <string.h> int main() { char arr1[] = "abcdefabcdef"; char arr2[] = "def"; char* ret = strstr(arr1, arr2); if (ret != NULL) { printf("%s\n", ret);//defabcdef } else { printf("找不到\n"); } return 0; }
#include <stdio.h> #include <string.h> int main() { char arr1[] = "abcdefabcdef"; char arr2[] = "deq"; char* ret = strstr(arr1, arr2); if (ret != NULL) { printf("%s\n", ret); } else { printf("找不到\n"); } //找不到对应的字符串,返回的是NULL,所以打印找不到 return 0; }
strstr函数的模拟实现:
#include <stdio.h> char* my_strstr(const char* str1, const char* str2) { char* cp = str1; char* s1 = cp; char* s2 = str2; while (*cp) { //开始匹配 s1 = cp; s2 = str2; while (*s1 && *s2 && *s1 == *s2) { s1++; s2++; } if ('\0' == *s2) { return cp; } cp++; } return NULL; } int main() { char arr1[] = "abbbcdef"; char arr2[] = "bbc"; char* ret = my_strstr(arr1, arr2); if (ret != NULL) { printf("%s\n", ret);//bbcdef } else { printf("找不到\n"); } return 0; }
2.9 strtok
char* strtok(char* str, const char* sep);
- sep参数是个字符串,定义了用作分隔符的字符集合。
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
- strtok函数找到str中的下一个标记,并将其用 ‘\0’ 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h> #include <string.h> int main() { char arr[] = "zhangsan@yeah.net"; char copy[20]; strcpy(copy, arr); char sep[] = "@."; char* ret = strtok(copy, sep); printf("%s\n", ret);//zhangsan ret = strtok(NULL, sep); printf("%s\n", ret);//yeah ret = strtok(NULL, sep); printf("%s\n", ret);//net return 0; }
但是如果我们不知道它被分成了几段,那么我们应该怎么把它们全部打印出来呢?
#include <stdio.h> #include <string.h> int main() { char arr[] = "zhangsan@yeah.net@666#777"; char copy[30]; strcpy(copy, arr); char sep[] = "@.#"; char* ret = NULL; for (ret = strtok(copy, sep); ret != NULL; ret = strtok(NULL, sep)) { printf("%s\n", ret); } return 0; }
2.10 strerror
char* strerror(int errnum);
- 返回错误码所对应的错误信息。
- 库函数在执行的时候,发生了错误,会将一个错误码存放在errno这个变量中,errno是C语言提供的一个全局变量
#include <stdio.h> #include <string.h> int main() { int i = 0; for (i = 0; i < 10; i++) { printf("%d: %s\n", i, strerror(i)); } return 0; }
举个具体的例子:
#include <stdio.h> #include <string.h> #include <errno.h> int main() { //C语言中可以操作文件 //操作文件的步骤 //1. 打开文件 //2. 读/写文件 //3. 关闭文件 FILE* pf = fopen("data.txt", "r");//打开data.txt这个文件,而且是为了读来打开这个文件,这个函数返回的是一个FILE*的指针,打开失败返回的是空指针 if (NULL == pf) { printf("%s\n", strerror(errno)); //如果当前路径底下没有data.txt这个文件,就会打印No such file or directory return 1;//和ruturn 0做个区分,这是失败返回的 } //读文件 //... //关闭文件 fclose(pf); return 0; }
还有一个函数可以直接就把错误信息打印出来:
#include <stdio.h> int main() { //C语言中可以操作文件 //操作文件的步骤 //1. 打开文件 //2. 读/写文件 //3. 关闭文件 FILE* pf = fopen("data.txt", "r"); if (NULL == pf) { perror("fopen");//如果当前路径底下没有data.txt这个文件,就会打印fopen: No such file or directory //先打印fopen: ,然后再打印错误信息 //perror里面的内容可以自定义 return 1; } //读文件 //... //关闭文件 fclose(pf); return 0; }
2.11 字符分类函数
注:
ASCII码表中0~31是不可打印字符,其他是可打印字符。
#include <stdio.h> #include <ctype.h> int main() { //isupper //大写返回非0 //其他返回0 printf("%d\n", isupper('A'));//1 printf("%d\n", isupper('a'));//0 printf("%d\n", isdigit('2'));//4 printf("%d\n", isdigit('X'));//0 return 0; }
2.12 字符转换函数
int tolower(int c);
int toupper(int c);
#include <stdio.h> #include <ctype.h> int main() { printf("%c\n", tolower('A'));//a printf("%c\n", tolower('s'));//s return 0; }
最后,我们来看一道题目:
//将字符串中的内容全部改成小写 #include <stdio.h> #include <ctype.h> int main() { char arr[20] = { 0 }; gets(arr);//遇到空格继续读 //比如输入:I am a Good Student char* p = arr; while (*p) { if (isupper(*p)) { *p = tolower(*p); } p++; } printf("%s\n", arr);//i am a good student return 0; }