详解strlen的细节
首先了解strlen 函数的参数
size_t strlen ( const char * str );
size_t 是什么东西呢?
看下面的操作:
这里介绍一个快捷键,输入size_t后,按住ctrl + 鼠标左键,即可转到定义,或者右击鼠标,点击转到定义即可
所以 size_t == unsigned int ,strlen 的返回类型是无符号类型
注意这里,这是无符号整型!下面的介绍大有用处
下面介绍strlen 的用法:
strlen是一个库函数,它会顺着你 传过来的地址,一直往下找,直到找到\0为止,返回的是无符号整型
输出结果为6
再看下面的代码:
结果还是6吗,不再是6了,而是一个随机值。字符串这样放在数组里,没有\0,所以strlen会顺着arr不断往下找,什么时候找到\0,我们不得而知。
这证实strlen是顺着地址往下找的。
模拟实现strlen
int my_strlen(const char* str) { //const修饰的内容无法更改 int count = 0; assert(str != NULL); while (*str) { count++; str++; } return count; } int main() { int len = my_strlen("abcdef"); printf("%d\n", len); return 0; }
打印出来的结果仍然是6,这里要讲的重点不是如何实现strlen函数。
细心的你会发现:
strlen 函数的返回值不应该是size_t 吗,为什么上面写的是 my_strlen 是 int 类型呢?
是因为: 其实这两种写法都可以,各有利弊:
先看下面的一段代码:
int main() { if (strlen("abc") - strlen("abcdef") > 0) 注意这里是库函数的strlen { printf("hehe\n"); } else { printf("haha\n"); } return 0; }
请说出上面代码的输出结果:
没注意到细节,一定会说出会打印haha,运行出真知:
为什么呢?
回到上面的strlen的返回类型,size_t,是 unsigned int ,无符号整型,abc的长度是3,abcdef长度是6,那么3-6 == -3 ,-3作为 unsigned int 类型,是一个大于0的数,
打印结果如下图:
是一个大于0的数,所以会打印hehe,
假如是用自己的my_strlen 函数,结果如下:
这就很符合我们的认知, 3 - 6 == -3 <0,走else 语句。
不过,这两种写法,各有各的好处,假如你想跟着标准走的话,写size_t是绝对没有问题的,因为计算长度是不可能有负数的。
但是写 int 类型,也没有什么问题,单独计算一个字符串的长度时,返回值也是一个大于0的数,当3 - 6 == -3时,的确是会走if 语句,更符合我们的理解,不容易产生歧义。
所以两种写法各有利弊。
注意事项:
.strcpy函数的巧妙讲解
先看库函数的声明:
char * strcpy ( char * destination, const char * source ); 目的地 源头
需要两个地址,一个是目的地地址,一个是源头地址
举个例子:
int main() { char arr1[] = "abcdef"; char arr2[] = "hello"; strcpy(arr1, arr2); 将arr2字符串拷贝到arr1 printf("%s\n", arr1); }
运行结果如下:
下面来模拟实现:
模拟实现strcpy函数:
char* my_strcpy(char* dest, char* src) { assert(dest && src); char* ret = dest; while (*src!='\0') { *dest = *src; dest++; src++; } *dest = *src; //循环结束后,src指向了\0的位置,所以将\0也赋值给dest; return ret; } int main() { char arr1[] = "abcdef"; char arr2[] = "hello"; char *ret = my_strcpy(arr1, arr2); printf("%s\n", ret); }
特殊位置已注释讲解 ,但是你会发现,模拟代码还可以精简化
char* my_strcpy(char* dest, const char* src) 目标空间必须可变,源头空间不可变 { assert(dest && src); 判断指针的有效性 char* ret = dest; while (*dest++ = *src++); return ret ; }
每次src对应的字符赋值给dest后,再++,dest也++,然后进行判断,如果为\0 , \0的ascii码值为0,while为0,退出循环
这样的代码才是,满分代码strcpy注意事项:
char arr1[] = { 'a','b','c','d','e','f' }; 错误代码:字符串无\0 char arr1 = "abcdef"; 错误代码:常量字符串无法更改
请注意第三点:目标空间必须足够大。
这是因为strcpy这个函数,它只管拷贝,只管找到\0才停止,它才不管你的空间够不够,这就是strcpy函数的脾气,所以必须充分了解。
strcmp函数详解
首先了解函数的声明:
int strcmp ( const char * str1, const char * str2 );
strcmp的参数是两个不可更改的char*的指针
返回值:当第一个字符串大于第二个时,返回一个大于0的数,当第一个字符串小于第二个时,返回小于0的数,等于时,返回0
测试一下结果:
但是这里,在visual studio环境下,返回值只是-1,0,1,是不是说这个strcmp函数有问题呢?其实并不是,当我们模拟实现的时候就能够发现。
下面来模拟实现strcmp函数:
模拟实现strcmp
int my_strcmp(const char* str1, const char* str2) { assert(str1 && str2); while (*str1 == *str2) { if (*str1 == '\0') { return 0;//相等的情况 } str1++; str2++; } return (*str1 - *str2);//不相等的情况 } int main() { char* p1 = "abcdef"; char* p2 = "sqwer"; int ret = my_strcmp(p1,p2); printf("%d", ret); return 0; }
可以看到,a和s相比,相差了18,a的ascii码值是97,s的ascii码值是115,两者相减,结果就是-18,所以p1 小于 p2
strcat函数剖析
这是一个追加函数,意思是在原字符串的末尾,继续追加其他字符串。
char * strcat ( char * destination, const char * source );
该函数的声明如上:
参数是两个指针,一个是目的地指针,一个是源头指针。
返回类型是目的地起始地址。
int main() { char arr1[30] = "hello"; char arr2[] = "world"; strcat(arr1, arr2); printf("%s\n", arr1);
来看一下strcat函数的实现过程,
在arr1之后追加了arr2.
但是会不会连world末尾的\0也追加上去呢?
答案是会的:
可知,world后面连\0也追加上去了;
那么能不能自己追加自己?
可以看到,程序崩溃了
原因究竟是什么?
调试之后我们发现,arr1没有\0了!,hello未被追加时,后面还有一个\0,但是追加之后,arr2是从\0开始追加的,所以当我们追加之后,\0已经被覆盖了。所以它会无限追加下去。所以这个程序就崩溃了。
模拟实现strcat函数:
char* my_strcat(char* dest, const char* src) { assert(dest && src); char* ret = dest; //1.找到目的字符串的\0位置 while (*dest!='\0') { dest++; } //2.追加的过程其实就是拷贝的过程 while (*dest++ = *src++) { ; } return ret; } int main() { char arr1[30] = "hello"; char arr2[] = "world"; my_strcat(arr1, arr2); printf("%s\n", arr1); }
重点部分已经作了注释:
不过有几点要注意一下:
与strlen相似,如果源字符串后无\0,这就像自己追加自己,导致程序崩溃
如下图:
arr1的只有6个大小的空间,如果强制追加arr2上去,就会导致程序崩溃。
当源头字符串后面没有\0时,会出现:
追加过去之后,但是后面没有\0,就没有\0追加,无结束标志,程序会崩溃。
如果对你有帮助的话,就关注一下吧!