【C语言篇】字符和字符串以及内存函数的详细介绍与模拟实现(上篇):https://developer.aliyun.com/article/1590575?spm=a2c6h.13148508.setting.15.1ee34f0eXf1RYz
前言
本篇接上一篇:
字符串函数
strstr的使用和模拟实现
char * strstr ( const char * str1, const char * str2);
- 函数返回字符串
str2
在字符串str1
中第⼀次出现的位置 - 字符串的⽐较匹配不包含 ‘
\0
’ 字符,以 ‘\0
’ 作为结束标志
/* strstr example */ #include <stdio.h> #include <string.h> int main () { char str[] ="This is a simple string"; char * pch; pch = strstr (str,"simple"); strncpy (pch,"sample",6); printf("%s\n", str); return 0; }
strstr
函数的模拟实现:
//strstr函数模拟实现 #include <stdio.h> #include <assert.h> #include <string.h> char* my_strstr(const char* dest, const char* src) { assert(dest && src); char* tmp = (char*)dest; if (!*src) return tmp; char* s1; const char*s2; while (*tmp)//从tmp指针指向的字符开始与src比较,若相同就比较后面的,不相同则tmp++ { s1 = tmp; s2 = src; while (*s1 && *s2&&*s1==*s2) { s1++; s2++; } if (!*s2) return tmp; tmp++; if (strlen(tmp) < strlen(src))//比较tmp之后的字符数和src的字符个数,若前者小则不可能找到 return NULL; } return NULL;//特殊情况,例如若dest只有"\0",src为"a\0";那不会进入循环, //就需要一个返回值NULL;其余情况皆在循环中返回值 } int main() { char*s1 = "hello world! hello"; char* s2 = "llo"; char* s3 = my_strstr(s1, s2); //char* s3 = strstr(s1, s2); printf("%s", s3); return 0; }
strtok函数的使用
在我们生活中经常会看到以下字符串:
- 192.168.110.123
- xiaoming@qq.com
那我们可不可以把这些字符串中的分隔符给剔除只保留剩下的数字字符或者英文字符呢?
针对这种情况,我们就可以使用strtok函数
char * strtok ( char * str, const char * sep);
- sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
- 第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记
- strtok函数找到str中的下⼀个标记,并将其⽤ '\0 '结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。)
- strtok函数的第⼀个参数不为 NULL ,函数将找到str中第⼀个标记,strtok函数将其⽤ '\0 '结尾,然后保存它在字符串中的位置。
- strtok函数的第⼀个参数为 NULL ,函数将在同⼀个字符串中被保存的位置开始,查找下⼀个标记
- 如果字符串结束即再也找不到其他标记,则返回 NULL 指针
strtok函数的使用:
#include <stdio.h> #include <string.h> int main() { char arr[] = "192.168.6.111"; char* sep = "."; char* str = NULL; for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep)) { printf("%s", str);//1921686111 } return 0; }
利用for循环初始化只执行一次
strerror函数的使用
strerror函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码,⼀般是放在 errno.h 这个头⽂件中说明 的,C语⾔程序启动的时候就会使⽤⼀个全局的变量errno来记录程序的当前错误码,只不过程序启动的时候errno是0,表⽰没有错误。
当我们在使⽤标准库中的函数的时候发⽣了某种错误,就会将对应的错误码,存放在errno中,⽽⼀个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。
#include <errno.h> #include <string.h> #include <stdio.h> //我们打印⼀下0~10这些错误码对应的信息 int main() { int i = 0; for (i = 0; i <= 10; i++) { printf("%s\n", strerror(i)); } return 0; }
在Windows11+VS2022环境下输出的结果如下:
No error Operation not permitted No such file or directory No such process Interrupted function call Input/output error No such device or address Arg list too long Exec format error Bad file descriptor No child processes
举例:
以只读的形式打开一个不存在的文件,会发生错误:
#include <stdio.h> #include <errno.h> int main () { FILE * pFile; pFile = fopen ("unexist.ent","r"); if (pFile == NULL) printf ("Error opening file unexist.ent: %s\n", strerror(errno)); return 0; }
输出:
Error opening file unexist.ent: No such file or directory
也可以了解⼀下perror
函数,perror
函数相当于⼀次将上述代码中的第9⾏完成了,直接将错误信息打印出来。perror
函数打印完参数部分的字符串后,再打印⼀个冒号和⼀个空格,再打印错误信息。
void perror ( const char * str )
- 先打印str指向的字符串(可以为空),然后打印冒号加一个空格,最后打印错误信息
#include <stdio.h> int main () { FILE * pFile; pFile = fopen ("unexist.ent","r"); if (pFile == NULL) perror("Error opening file unexist.ent"); return 0; }
输出:
Error opening file unexist.ent: No such file or directory
在实际的处理数据过程中,肯定不可能只有字符串,所以C语言提供了一些内存函数,可以操作内存块,以下介绍常用的四个:
内存函数
memcpy使用和模拟实现
1 void * memcpy ( void * destination, const void * source, size_t num );
- 函数
memcpy
从source
的位置开始向后复制num
个字节的数据到destination
指向的内存位置。 - 这个函数在遇到 '
\0'
的时候并不会停下来。 - 如果
source
和destination
有任何的重叠,复制的结果都是未定义的。 - 头文件
string.h
#include <stdio.h> #include <string.h> int main() { int arr1[] = { 1,2,3,4,5,6,7,8,9,10 }; int arr2[10] = { 0 }; memcpy(arr2, arr1, 20); int i = 0; for (i = 0; i < 10; i++) { printf("%d ", arr2[i]); } return 0; }
输出的结果:
1 2 3 4 5 0 0 0 0 0
memcpy
的模拟实现:
void * memcpy ( void * dst, const void * src, size_t count) { void * ret = dst; assert(dst); assert(src); /* copy from lower addresses to higher addresses */ while (count--) { *(char *)dst = *(char *)src; dst = (char *)dst + 1; src = (char *)src + 1; } return(ret); }
对于重叠的内存,交给memmove来处理。
memmove使用和模拟实现
void * memmove ( void * destination, const void * source, size_t num );
- 和
memcpy
的差别就是memmove
函数处理的源内存块和⽬标内存块是可以重叠的。 - 如果源空间和⽬标空间出现重叠,就得使⽤
memmove
函数处理。 - 头文件
string.h
#include <stdio.h> #include <string.h> int main() { int arr1[] = { 1,2,3,4,5,6,7,8,9,10 }; memmove(arr1+2, arr1, 20); int i = 0; for (i = 0; i < 10; i++) { printf("%d ", arr1[i]); } return 0; }
输出的结果:
1 2 1 2 3 4 5 8 9 10
memmove
的模拟实现:
- 如果
dest
低地址,则从前往后拷贝 - 反之从后往前拷贝
//模拟实现memmove #include <stdio.h> #include <string.h> #include <assert.h> void* my_memmove(void* dest, const void* src, size_t num) { void* ret = dest; assert(dest && src); char* s1 = (char*)dest; char* s2 = (char*)src; if (dest < src) { while (num--) { *s1++ = *s2++; } } else { while (num--) { *(s1 + num) = *(s2 + num);//利用num--,最后num==0不进入循环,此时再把*s2赋值给*s1就完成了 } *s1 = *s2; } return ret; }
memset函数的使用
void * memset ( void * ptr, int value, size_t num );
memset是⽤来设置内存的,将内存中的值以字节为单位设置成想要的内容。头文件也是string.h
#include <stdio.h> #include <string.h> int main () { char str[] = "hello world"; memset (str,'x',6); printf(str); return 0; }
输出的结果:
xxxxxxworld
memcmp函数的使用
int memcmp ( const void * ptr1, const void * ptr2, size_t num );
- ⽐较从ptr1和ptr2指针指向的位置开始,向后的num个字节
- 头文件
stdio.h
- 返回值如下:
#include <stdio.h> #include <string.h> int main() { char buffer1[] = "DWgaOtP12df0"; char buffer2[] = "DWGAOTP12DF0"; int n; n = memcmp(buffer1, buffer2, sizeof(buffer1)); if (n > 0) printf("'%s' is greater than '%s'.\n", buffer1, buffer2); else if (n < 0) printf("'%s' is less than '%s'.\n", buffer1, buffer2); else printf("'%s' is the same as '%s'.\n", buffer1, buffer2); return 0; }