C语言之详解字符操作函数

简介: C语言中对字符和字符串的处理是非常频繁的,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。而字符串常量适用于那些对它不做修改的字符串函数。

求字符串长度

strlen

函数介绍

strlen------size_t strlen(const char* str)


1.字符串以’\0’作为结束标志,strlen函数返回的是在字符串中’\0’前面出现的字符个数(不包含’\0’)。

2.参数指向的字符串必须要以’\0’结束。

3.注意函数返回值类型为size_t,是无符号的。

4.学会strlen函数的模拟实现


先来用一段代码来简单的写一个程序:

1.png


模拟实现

上面是利用已有的库函数strlen来实现功能,那我们也可以通过自已设计的一个类似于strlen的函数。这里展现三种方法:

1.计数器的方法

2.递归

3.指针-指针

首先展示计数器的方法:

#include<stdio.h>
int my_strlen(char* str)
{
  int count = 0;
  while (*str != '\0')
  {
  count++;
  str++;
  }
  return count;
}
int main()
{
  int len = my_strlen("helloworld");
  printf("len=%d\n", len);
  return 0;
}

再来展示递归方法:

#include<stdio.h>
#include<string.h>
int my_strlen(char* str)
{
  if (*str != '\0')
  return 1 + my_strlen(str + 1);
  else
  return 0;
}
int main()
{
  char arr[] = "helloworld";
  int len = my_strlen(arr);
  printf("len=%d\n", len);
  return 0;
}

再来展示指针-指针的方法:

#include<stdio.h>
int my_strlen(char* str)
{
  int tmp = str;
  while (*str != '\0')
  {
  str++;
  }
  return str - tmp;
}
int main()
{
  char arr[] = "hello world";
  int len = my_strlen(arr);
  printf("len=%d\n", len);
  return 0;
}

上面三种方法就是模拟实现strlen函数

下面来看一段代码:

#include<stdio.h>
#include<string.h>
int main()
{
  if (strlen("abc") - strlen("abcdef") > 0)
  printf("hehe\n");
  else
  printf("haha\n");
  return 0;
}

请问上述代码打印的是hehe还是haha呢?在说出答案之前,我们需要了解到strlen函数返回的是无符号数,两个无符号数相减得到的依然是无符号数,虽然上述代码计算得出的为(3-6=-3),结果为-3但是别忘了,这个值是一个无符号数,-3的补码在内存中会被当作无符号数来看待,所以最终得到的是一个正数。所以答案打印出来的是hehe🙂。

这里要注意的是strlen函数返回的是无符号数。size_t strlen(const char* string ),size_t相当于unsigned int即无符号数。

而我们刚刚自己实现的一个my_strlen函数,即int my_strlen(const char* str)返回的是一个int。


长度不受限制的字符串函数

strcpy

strcpy------char* strcpy(char * destination, const char * source)

函数介绍


1.源字符必须以’\0’结束。

2.会将源字符串中的’\0’拷贝到目标空间。

3.目标空间必须足够大,以确保能存放源字符串。

4.目标空间必须可变。

5.学会该函数的模拟实现


举个例子:

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[] = "abcdefghi";
  char arr2[] = "world";
  strcpy(arr1, arr2);
  printf("%s", arr1);
  return 0;
}

2.png

模拟实现

下面我们来模拟实现strcpy函数:

#include<stdio.h>
#include<string.h>
#include<assert.h>
void my_strcpy(char* dest, char* src)
{
  assert(dest != NULL);
  assert(src != NULL);
  while (*src != '\0')
  {
  *dest = *src;
  dest++;
  src++;
  }
  *dest = *src;
}
int main()
{
  char arr1[] = "abcdef";
  char arr2[] = "world";
  my_strcpy(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

对上述代码进行优化,即:


#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strcpy(char* dest,const char* src)
{
  assert(dest != NULL);
  assert(src != NULL);
  char* ret = dest;
  //拷贝src指向的字符串到dest指向的空间,包含'\0'
  while (*dest++ = *src++)
  {
  ;
  }
  //返回目的空间的起始地址
  return ret;
}
int main()
{
  char arr1[] = "abcdef";
  char arr2[] = "world";
  my_strcpy(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

这才是真正的满分代码。


strcat

strcat------char* strcat(char * destination, const char * source);


1.源字符串必须以’\0’最为结束。

2.目标空间必须足够大,能容纳下源字符串的内容。

3.目标空间必须可修改。

4.学会该函数的模拟实现

5.目标字符串中必须也有’\0’,否则要从哪里开始追加就不清楚了。


来看一个典型错误:

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[] = "hello";
  char arr2[] = "world";
  strcat(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

这样做会造成越界访问。

3.png


所以说我们的目的地必须足够强大,来存放追加的数据。

这里有一个疑问,当我们进行字符串追加时,有没有把'\0'追加过去呢?这里我们可以通过代码实践一下就可以了。请看:

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[30] = "hello\0xxxxxxxx";
  char arr2[] = "world";
  strcat(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

4.png

根据调试结果我们可以发现strcat函数在进行字符串追加时也会把'\0'追加到目的地。

注意当strcat函数自己给自己进行追加时,程序会崩溃。


模拟实现

下面我们自己来写一个函数来实现strcat函数的功能。请看:


#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strcat(char* dest, const char* src)
{
  char* ret = dest;
  assert(dest && src);
  //找到目的字符串中的'\0'
  while (*dest != '\0')
  {
  dest++;
  }
  //追加
  while (*dest++ = *src++)
  {
  ;
  }
  return ret;
}
int main()
{
  char arr1[30] = "hello\0xxxxxxxx";
  char arr2[] = "world";
  my_strcat(arr1, arr2);
  printf("%s\n", arr1);
  return 0;
}

strcmp

strcmp------int strcmp(const char * str1, const char * str2)。

标准规定:


1.第一个字符串大于第二个字符串,则返回大于0的数字

2.第一个字符串等于第二个字符串,则返回0

3.第一个字符串小于第二个字符串,则返回小于0的数字


举个例子:

#include<stdio.h>
#include<string.h>
int main()
{
  char* p1 = "qbcdef";
  char* p2 = "asjix";
  int ret = (strcmp(p1, p2));
  printf("ret=%d\n", ret);
  return 0;
}

在代码运行起来后,发现在VS编译下,strcmp函数的返回值只有1、-1、0。前提这是在VS环境下。但是不同的编译器下strcmp函数返回的值是不同的。

#include<stdio.h>
#include<string.h>
int main()
{
  char* p1 = "qbcdef";
  char* p2 = "asjix";
  if (strcmp(p1, p2) > 0)
  {
  printf("p1>p2\0");
  }
  else if (strcmp(p1, p2) < 0)
  {
  printf("p1<p2");
  }
  else
  printf("p1==p2");
  return 0;
}

再次强调,一定要注意strcmp函数的返回值,不同的编译环境下返回值是可能是不同的。


模拟实现

#include<stdio.h>
#include<string.h>
#include<assert.h>
int my_strcmp(const char* str1, const char* str2)
{
  assert(str1 && str2);
  while (*str1 == *str2)
  {
  str1++;
  str2++;
  }
  /*if (*str1 > *str2)
  return 1;
  else
  return -1;*/
  return(*str1 - *str2);//这种方式也可以
}
int main()
{
  char* p1 = "abcdefg";
  char* p2 = "abczgujj";
  int ret = my_strcmp(p1, p2);
  printf("ret=%d\n", ret);
  return 0;
}



长度受限制的字符串函数介绍

strncpy

strncpy------

char *strncpy(char *strDest,const char *strSource,size_t count)。


拷贝num个字符从源字符串到目标空间

如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后面追加0,直到num个。

其中count单位是字节。

5.png

那这里有没有把\0拷贝过去呢?我们一试便知:

6.png

可以看出strncpy函数并没有把\0拷贝过去。

再来看一段代码及调试过程:

7.png

注意:通过观察可以发现当指定的个数比源的字符串多时,在这里依然会拷贝6个,不够时会拿\0来补充。


模拟实现

#include<stdio.h>
#include<assert.h>
#include<string.h>
char* my_strncpy(char* dest, const char* src, size_t n)
{
  assert(dest && src);
  char* ret = dest;
  while (n&&(*dest++ = *src++))
  {
  n--;
  }
  if (n)
  {
  while (n--)
  {
    *dest++ = '\0';
  }
  }
  return ret;
}
int main()
{
  char arr1[] = "hello world";
  char arr2[] = "i am a student";
  printf("%s\n", my_strncpy(arr2, arr1, strlen(arr1)));
  return 0;
}

上述模拟实现主要分两种情况:

其一:当字符串源头的长度大于等于copy的数目时,根据字符数目照常复制即可。

其二:当字符串源头的长度小于copy的数目时,剩下几个copy数目,就在字符串目的地后面加几个\0。

strncat

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[30] = "hello";
  char arr2[] = "world";
  strncat(arr1, arr2, 3);
  printf("%s\n", arr1);
  return 0;
}

我们依然验证一下在追加完源字符串后会不会补充\0。请看:

8.png

可以看出strncat函数会主动放一个\0进去。

再来看一段代码:

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[30] = "hello\0xxxxxxxxxxxxxxxxx";
  char arr2[] = "world";
  strncat(arr1, arr2, 8);
  printf("%s\n", arr1);
  return 0;
}

9.png

通过调试结果可以发现如果个数比我们要追加的这个源字符串长时,我们补充完一个\0之后就啥也不管了。我们可以对比一下strncpy函数,对于strncpy函数而言,如果个数比要拷贝的字符串长时,我们会补齐那么多个,但是strncat函数可不会管这么多个。

对于strncat函数,无论追加多少个,它最后都会在后面补一个\0。


strncmp

strncmp------int strncmp(const char *string1, const char *string2,size_t count)。


出现到另一个字符不一样或者一个字符串结束或者num个字符全部比较完。


请看代码举例:

#include<stdio.h>
#include<string.h>
int main()
{
  const char* p1 = "abczef";
  const char* p2 = "abctefh";
  int ret = strncmp(p1, p2, 4);
  printf("ret=%d\n", ret);
  return 0;
}

字符串查找

strstr

strstr------字符串查找

代码举例:

#include<stdio.h>
#include<string.h>
int main()
{
  char* p1 = "abcdef";
  char* p2 = "def";
  char* ret = strstr(p1, p2);
  if (ret == NULL)
  printf("子串不存在\n");
  else
  printf("%s\n", ret);
  return 0;
}

模拟实现

//strstr---查找字符串
#include<stdio.h>
#include<string.h>
#include<assert.h>
char* my_strstr(const char* p1,const char* p2)
{
  assert(p1 && p2);
  char* s1 = NULL;
  char* s2 = NULL;
  char* cur = (char*)p1;
  if (*p2 == '\0')
  {
  return (char*)p1;
  }
  while (*cur)
  {
  s1 = cur;
  s2 = (char*)p2;
  while (*s1 && *s2 && (*s1 == *s2))
  {
    s1++, s2++;
  }
  if (*s2 == '\0')
  {
    return cur;//找到子串
  }
  if (*s1 == '\0')
  {
    return NULL;
  }
  cur++;
  }
  return NULL;//找不到子串
}
int main()
{
  char* p1 = "abcdef";
  char* p2 = "def";
  char* ret = my_strstr(p1, p2);
  if (ret == NULL)
  printf("子串不存在\n");
  else
  printf("%s\n", ret);
  return 0;
}

strtok

strtok------char * strtok(char * str, const char * sep)


  • 1.sep参数是一个字符串,定义了用作分隔符的字符集合
  • 2.第一个参数指定一个字符串,它包含了0个或多个由sep字符串中一个或者多个分隔符分割的标记。
  • 3.strtok函数找到str中的下一个标记,并将其用\0结尾,返回一个指向这个标记的指针。(这里要注意:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可以修改。)
  • 4.strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • 5.strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 6.如果字符串不存在更多的标记,则返回NULL指针。


请看举例:

#include<stdio.h>
#include<string.h>
int main()
{
  char arr[] = "abcd@efg.hijk";
  char* p = "@.";
  char buf[1024] = { 0 }; 
  strcpy(buf, arr);
  char* ret=strtok(arr,p);
  printf("%s\n", ret);
  ret = strtok(NULL, p);
  printf("%s\n", ret);
  ret = strtok(NULL, p);
  printf("%s\n", ret);
  return 0;
}

对上面代码进行改进:

#include<stdio.h>
#include<string.h>
int main()
{
  char arr[] = "abcd@efg.hijk";
  char* p = "@.";
  char buf[1024] = { 0 };
  strcpy(buf, arr);
  char* ret = NULL;
  for (ret = strtok(buf, p); ret != NULL; ret = strtok(NULL, p))
  {
  printf("%s\n", ret);
  }
  return 0;
}

strtok函数在调用时会记住上次找到分隔符的位置,下次再次调用strtok函数时它会从记住的那个位置继续先后找。所以strtok函数本身就有记忆的一些功能,它会把一些执行过程中的一些值记录下来,下次调用它的时候就可以继续使用刚刚记录下来的值。

那strtok函数是怎么记录这些值的呢?这个函数内部就应该创建静态变量,当一个函数内部创建一些静态变量之后,出来该函数时不会销毁,下次进去的时候它依然会存在。


错误信息函数

strerror

strerror------char * strerror( int errnum)


返回错误码所对应的错误信息

#include<stdio.h>
#include<string.h>
int main()
{
  char* str1 = strerror(1);
  printf("%s\n", str1);
  char* str2 = strerror(2);
  printf("%s\n", str2);
  char* str3 = strerror(3);
  printf("%s\n", str3);
  return 0;
}

下面是运行结果:

10.png


1------Operation not permitted

2------No such file or directory

3------No such process


这里的1、2、3是错误码,每一个错误码对应着一个错误信息,就是我们的代码在执行过程中,发现哪个地方出问题了,那怎么办呢?这个时候,就制造一些错误码,在我们的程序之间流转,程序之间流转的错误码是没有问题的,但是用户去看的时候是不知道这里的1、2、3是什么意思的,那我们肯定是希望把这里的1、2、3这样的错误码转换成错误信息。上面的Operation not permitted、No such file or directory、No such process是错误信息描述。而strerror函数就是用来把我们的错误码转换成错误信息,然后返回它的地址,这就是strerror函数的基本作用。它可以把错误码翻译成所对应的错误信息。

另外在刚刚的代码中的1、2、3是我们放进去的,但是真实在代码中不是这样写的,而应该是这样的:

#include<stdio.h>
#include<string.h>
#include<errno.h>
int main()
{
  char* str = strerror(errno);
  printf("%s\n", str);
  return 0;
}

这里的errno是一个全局的错误码的变量,当C语言的库函数在执行过程中,发生了错误,就会把对应的错误码赋值到errno中。

举例:

#include<stdio.h>
#include<string.h>
#include<errno.h>
int main()
{
  FILE* pf = fopen("test.txt", "r");
  if (pf == NULL)
  {
  printf("%s\n", strerror(errno));
  }
  else
  {
  printf("open file success\n");
  }
  return 0;
}

11.png

字符分类函数

字符分类函数头文件为ctype.h


  • 函数---------------如果它的参数符合下列条件就返回真
  • iscntrl-------------任意控制字符
  • isspace-----------空白字符:空格’ ‘,换页’lf’,换行’\n’,回车’\r’,制表符’\t’或者垂直制表符’\v’。
  • isdigit-------------十进制数字0到9
  • isxdigit-----------十六进制数字,包括所有十进制数字,小写字母a-f,大写字母A到F。
  • islower-----------小写字母a到z
  • isupper----------大写字母A到Z
  • isalnum----------字母或者数字,a到z,A到Z,0到9
  • ispunct-----------标点符号,任何不属于数字或者字母的图形字符(可打印)
  • isgraph----------任何图形字符
  • isprint------------任何可打印字符


字符转换函数

tolower和toupwer

tolower------int tolower (int c)

toupper------int toupper(int c)


举个例子:

#include<stdio.h>
#include<ctype.h>
int main()
{
  char ch1 = tolower('E');
  char ch2 = tolower('e');
  char ch3 = toupper('f');
  char ch4 = toupper('F');
  putchar(ch1);//e
  putchar(ch2);//e
  putchar(ch3);//F
  putchar(ch4);//F
  return 0;
}

12.png

举个例子:

#include<stdio.h>
#include<ctype.h>
int main()
{
  int i = 0;
  char arr[] = "I AM A STUDENT";
  while (arr[i])
  {
  if (isupper(arr[i]))
  {
    arr[i] = tolower(arr[i]);
  }
  i++;
  }
  printf("%s\n", arr);
  return 0;
}

13.png

本文至此结束,感谢!!!

目录
相关文章
|
24天前
|
C语言 C++
C语言 之 内存函数
C语言 之 内存函数
31 3
|
15天前
|
存储 缓存 C语言
【c语言】简单的算术操作符、输入输出函数
本文介绍了C语言中的算术操作符、赋值操作符、单目操作符以及输入输出函数 `printf` 和 `scanf` 的基本用法。算术操作符包括加、减、乘、除和求余,其中除法和求余运算有特殊规则。赋值操作符用于给变量赋值,并支持复合赋值。单目操作符包括自增自减、正负号和强制类型转换。输入输出函数 `printf` 和 `scanf` 用于格式化输入和输出,支持多种占位符和格式控制。通过示例代码详细解释了这些操作符和函数的使用方法。
30 10
|
8天前
|
存储 算法 程序员
C语言:库函数
C语言的库函数是预定义的函数,用于执行常见的编程任务,如输入输出、字符串处理、数学运算等。使用库函数可以简化编程工作,提高开发效率。C标准库提供了丰富的函数,满足各种需求。
|
14天前
|
机器学习/深度学习 C语言
【c语言】一篇文章搞懂函数递归
本文详细介绍了函数递归的概念、思想及其限制条件,并通过求阶乘、打印整数每一位和求斐波那契数等实例,展示了递归的应用。递归的核心在于将大问题分解为小问题,但需注意递归可能导致效率低下和栈溢出的问题。文章最后总结了递归的优缺点,提醒读者在实际编程中合理使用递归。
37 7
|
14天前
|
存储 编译器 程序员
【c语言】函数
本文介绍了C语言中函数的基本概念,包括库函数和自定义函数的定义、使用及示例。库函数如`printf`和`scanf`,通过包含相应的头文件即可使用。自定义函数需指定返回类型、函数名、形式参数等。文中还探讨了函数的调用、形参与实参的区别、return语句的用法、函数嵌套调用、链式访问以及static关键字对变量和函数的影响,强调了static如何改变变量的生命周期和作用域,以及函数的可见性。
25 4
|
19天前
|
存储 编译器 C语言
C语言函数的定义与函数的声明的区别
C语言中,函数的定义包含函数的实现,即具体执行的代码块;而函数的声明仅描述函数的名称、返回类型和参数列表,用于告知编译器函数的存在,但不包含实现细节。声明通常放在头文件中,定义则在源文件中。
|
25天前
|
C语言
c语言回顾-函数递归(上)
c语言回顾-函数递归(上)
30 2
|
27天前
|
Java 编译器 C语言
【一步一步了解Java系列】:Java中的方法对标C语言中的函数
【一步一步了解Java系列】:Java中的方法对标C语言中的函数
18 3
|
30天前
|
存储 程序员 编译器
C语言——动态内存管理与内存操作函数
C语言——动态内存管理与内存操作函数
|
30天前
|
C语言
C语言字符(串)函数
C语言字符(串)函数