字符函数和字符串函数

简介: 字符函数和字符串函数

前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。

常量字符串适用于那些对它不做修改的字符串函数。

字符分类函数

C语言中有一系列的函数是专门做字符分类,也就是一个字符是属于什么类型的字符的。

这些函数的使用都需要包含一个头文件ctype.h

函数 如果它的参数符合下列条件就返回真
iscntrl 任何控制字符
isspace 空白字符:空格‘ ’,换页‘\f’,换行‘\n’,回车‘\r’,制表符‘\t’,或者垂直制表符‘\v’
isdigit 十进制数字‘0’~‘9’字符
isxdigit 十六进制数字,包括所有十进制数字字符,小写字母a~f,大写字母A~F
islower 小写字母a~z
isupper 大写字母A~Z
isalpha 字母a~z或A~Z
isalnum

字母或者数字,a~z,A~Z,0~9

ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符

函数介绍

strlen

size_t strlen( const char* str );
  • 字符串以 ‘ \0 ’作为结束标志,strlen 函数返回的是再字符串中' \0 '前面出现的字符个数(不包括' \0 ' )。
  • 参数指向的自负床必须以 ' \0 ' 结束。
  • 注意函数的返回值为size_t,是无符号的。(易错)
  • strlen的使用需要包含头文件<string.h>

正常情况下的strlen的使用

#include<stdio.h>
#include<string.h>
int main()
{
  char arr[] = "abcdef";//abcdef\0
  int len = strlen(arr);
  printf("%d\n", len);
  return 0;
}

返回结果为6。一共是六个字符。

在没有' \0 '的情况下

#include<stdio.h>
#include<string.h>
int main()
{
  char arr[] = { 'a','b','c' };
  int len = strlen(arr);
  printf("%d\n", len);
  return 0;
}

这里返回的就是一个随机值,因为没有' \0 '函数就会一直查找下去,直到遇到内存中的' \0 '才会停止 ,所以这里返回的是随机值。

(易错)strlen的返回值是无符号类型

#include<stdio.h>
#include<string.h>
int main()
{
  if (strlen("abc") - strlen("abcdef"))
  {
    printf(">\n");
  }
  else
  {
    printf("<\n");
  }
  return 0;
}

对strlen的返回类型不了解容易产生错误

由于strlen返回的是无符号类型,所以无符号类型的变量相减,得到的也是无符号类型,不会有负数

#include<stdio.h>
#include<string.h>
int main()
{
  if (strlen("abc") - strlen("abcdef"))
  {
    printf(">\n");
  }
  else
  {
    printf("<\n");
  }
  return 0;
}

学会strlen函数的模拟实现      

学会strlen的模拟实现,可以让我们进一步地了解strlen 的内部结构,也能让我们掌握编写函数的能力。

当我们在编写函数的时候,都要想到3种方法,

1.计数器方法

2.指针-指针方法

3.递归方法

1.计数器方法

#include<stdio.h>
#include<string.h>
#include<assert.h>
size_t my_strlen(const char* str)
{
  size_t count = 0;
  assert(str);
  while (*str != '\0')
  {
    count++;
    str++;
  }
  return count;
}
int main()
{
  char arr[] = "abcdef";
  size_t n = my_strlen(arr);
  printf("%u\n", n);
  return 0;
}

2.指针-指针方法

这里是指针-指针的方法,通过指针-指针的方法同样可以实现strlen函数。

但是这里要注意:指针-指针,我们要用高地址的指针来减低地址的指针,不然就会返回负数,无符号类型没有负数就会返回一个较大的数,这里容易产生错误

#include<stdio.h>
#include<string.h>
#include<assert.h>
size_t my_strlen(const char* str)
{
  char* tmp = str;
  assert(str);
  while (*str != '\0')
  {
    str++;
  }
    return (str-tmp);
}
int main()
{
  char arr[] = "abcdef";
  size_t n = my_strlen(arr);
  printf("%u\n", n);
  return 0;
}

3.递归方法

递归就是直接或者间接地调用自身,把一个大型复杂的程序简化为规模较小的程序,将大量的程序用简单的程序来代替。

递归的主旨是将大事化小。

#include<stdio.h>
#include<string.h>
#include<assert.h>
size_t my_strlen(const char* str)
{
  char count = 0;
  assert(str);
  if (*str == '\0')
    return 0;
  else
  {
    count++;
    str++;
  }
  return (count + my_strlen(str));
}
int main()
{
  char arr[] = "abcdef";
  size_t n = my_strlen(arr);
  printf("%u\n", n);
  return 0;
}

strcpy

字符串拷贝

把source空间的字符串传给destination空间里去。

char* strcpy( char* destination, const char* source )
  • 源字符串必须以 '\0' 结束。
  • 会将源字符串中的 '\0' 拷⻉到⽬标空间。
  • ⽬标空间必须⾜够⼤,以确保能存放源字符串。
  • ⽬标空间必须可修改。

正常情况下:

#include<stdio.h>
#include<string.h>
int main()
{
  char name[20] = { 0 };
  strcpy(name,"zhangsan");
  printf("%s\n", name);
  return 0;
}


源字符串必须以 '\0' 结束

这里的arr数组并没有这个‘ \0 ’就会导致不相干的其他内容被拷贝到数组中,并且会有数组越界。

#include<stdio.h>
#include<string.h>
int main()
{
  char name[20] = "xxxxxxxx";
  char arr[] = { 'a','b','c' };
  strcpy(name, arr);
  printf("%s\n", name);
  return 0;
}


⽬标空间必须⾜够⼤,以确保能存放源字符串

如果空间不够大,将大内存的内容存放到这个空间,系统就会崩溃,还会产生越界访问。


#include<stdio.h>
#include<string.h>
int main()
{
  char name[3] = "";
  char arr[] = "abcdef";
  strcpy(name, arr);
  printf("%s\n", name);
  return 0;
}


⽬标空间必须可修改

这里的“abcdef”是常量字符串,不可以修改,强行修改的话,就会产生访问冲突。

#include<stdio.h>
#include<string.h>
int main()
{
  char* p = "abcdef";
  char arr[] = "abc";
  strcpy(p, arr);
  return 0;
}

strcpy的模拟实现

strcpy的实现原理就是,

将字符串一一对应地从source移到dest上去。

source,dest表示的是字符数组,C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。

由于是数组,source ,dest表示的都是数组名,就是首元素的地址,source表示的就是 ' a '.

我们要把source搬到dest上,*dest = *source,就是将第一个元素搬过去

然后就是source++,dest++,逐个地将每一个元素都搬运过去。

assert,断言,作用是防止传过来的参数是空指针

#include<stdio.h>
char* my_strcpy(char* dest, const char* source)
{
  assert(dest && source);
  char* start = dest;
  while (*source != '\0')
  {
    *dest = *source;
    dest++;
    source++;
  }
  *dest = *source;
  return start;  //strcpy的返回值是目标字符串,所以要将原来的dest的位置记下来
}
int main()
{
  char arr1[] = "abcdef";
  char arr2[20] = { 0 };
  my_strcpy(arr2, arr1);
  printf("%s\n", arr2);
  return 0;
}

strcat

字符串追加,当我们想要在原有的字符串后面追加字符串。

char * strcat ( char * destination, const char * source )
  • 源字符串必须以 '\0' 结束。
  • ⽬标字符串中也得有 \0 ,否则没办法知道追加从哪⾥开始。
  • ⽬标空间必须有⾜够的⼤,能容纳下源字符串的内容。
  • ⽬标空间必须可修改。

正常使用

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[20] = "hello ";
  strcat(arr1, "world");
  printf("%s\n", arr1);
  return 0;
}


strcat的模拟实现

strcat的实现原理,

就是现在dest找到' \0 ',然后从' \0 ' 开始将需要追加的字符串加到后面。

1.找到dest 的' \0 ' ,如果dest不是' \0 ' ,那就dest++;

2.直到找到我们的' \0 '.拷贝字符串。

#include<stdio.h>
char* my_strcat(char* dest, const char* source)
{
  assert(dest && source);
  char* start = dest;
    //1.找到dest的' \0 '
  while (*dest != '\0')
  {
    dest++;
  }
    //2.拷贝字符串
  while (*dest++ = *source++)
  {
    ;
  }
  return start;
}
int main()
{
  char arr1[20] = "hello ";
  strcat(arr1, "world");
  printf("%s\n", arr1);
  return 0;
}

strcmp

介绍

比较字符串

int strcmp ( const char * str1, const char * str2 )

strcmp是一位一位通过ASCII码值进行比较的,如果是下面两个字符数组比较,就是

第一位一样,第二位一样

第三位arr2的q比arr1的c大,

那么arr2就比arr1大

#include<stdio.h>
int main()
{
  char arr1[20] = "abc";
  char arr2[] = "abcd";
  int num = strcmp(arr1, arr2);
  if (num < 0)
  {
    printf("<\n");
  }
  else if(num = 0)
  {
    printf("=\n");
  }
  else
  {
    printf(">\n");
  }
  return 0;
}

strcpy的模拟实现

strcpy的实现原理

通过ASCII码值进行一一比较,如果arr1,arr2的元素相同的话,就进行下一位的比较。

直到遇到不一样的元素进行比较,直接返回它们的差就可以了。

#include<stdio.h>
#include<string.h>
#include<assert.h>
int my_strcmp(const char* str1, const char* str2)
{
  assert(str1 && str2);
  while (*str1 == *str2)
  {
    str1++;
    str2++;
  }
  return *str1 - *str2;
}
int main()
{
  char arr1[20] = "abc";
  char arr2[] = "abcd";
  int num = my_strcmp(arr1, arr2);
  if (num < 0)
  {
    printf("<\n");
  }
  else if(num = 0)
  {
    printf("=\n");
  }
  else
  {
    printf(">\n");
  }
  return 0;
}

长度受限函数

strncpy

char * strncpy ( char * destination, const char * source, size_t num );


  • 拷⻉num个字符从源字符串到⽬标空间。
  • 如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。

strncpy的使用

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[20] = "abcdef";
  char arr2[] = "hello world";
  strncpy(arr1, arr2, 5);
  printf("%s\n", arr1);
  return 0;
}



源字符串的⻓度⼩于num

#include<stdio.h>
#include<string.h>
int main()
{
  char arr1[20] = "abcdef";
  char arr2[] = "bit";
  strncpy(arr1, arr2, 5);
  printf("%s\n", arr1);
  return 0;
}


strncpy的模拟实现

和strcpy不同的是,strncpy有长度的限制,原来的while循环,加上num--的限制条件。

如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。

char* my_strncpy(char* dest, const char* source, size_t num)
{
  assert(dest && source);
  char* start = dest;
  while (num && *source)
  {
    num--;
    *dest++ = *source++;
  }
  while(num != 0)
  {
    *dest = '\0';
    dest++;
    num--;
  }
  return start;
}

strncat

char * strncpy ( char * destination, const char * source, size_t num )
  • 将source指向字符串的前num个字符追加到destination指向的字符串末尾,再追加⼀个 \0 字 符。
  • 如果source 指向的字符串的⻓度⼩于num的时候,只会将字符串中到 \0 的内容追加到destination指向的字符串末尾。

strncat的使用

#include <stdio.h>
#include <string.h>
int main()
{
  char str1[20];
  char str2[20];
  strcpy(str1, "To be ");
  strcpy(str2, "or not to be");
  strncat(str1, str2, 6);
  printf("%s\n", str1);
  return 0;
}

strncmp

int strncmp ( const char * str1, const char * str2, size_t num )
⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不⼀样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0.

strstr

char * strstr ( const char * str1, const char * str2 )

  • 函数返回字符串str2在字符串str1中第⼀次出现的位置
  • 字符 串的⽐较匹配不包含 \0 字符,以 \0 作为结束标志

strstr的使用

如果存在子串的内容,就会返回子串在字符串中的位置。

#include <stdio.h>
#include <string.h>
int main()
{
  char email[] = "zpw@bitejiuyeke.com";
  char substr[] = "bitejiuyeke";
  char* ret = strstr(email, substr);
  if (ret == NULL)
  {
  printf("子串不存在\n");
  }
  else
  {
  printf("%s\n", ret);
  }
  return 0;
}


strstr的模拟实现

char* my_strstr(const char* str1, const char* str2)
{
  char* cp = (char*)str1;
  char* s1, * s2;
  if (!*str2)
    return((char*)str1);
  while (*cp)
  {
    s1 = cp;
    s2 = (char*)str2;
    while (*s1 && *s2 && !(*s1 - *s2))
      s1++, s2++;
    if (!*s2)
      return(cp);
    cp++;
  }
  return(NULL);
}

strtok

char * strtok ( char * str, const char * delimiters )


  • sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
  • 第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。
  • strtok函数找到str中的下⼀个标记,并将其⽤ \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以在使⽤strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。
  • strtok函数的第⼀个参数不为NULL ,函数将找到str中第⼀个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第⼀个参数为 NULL ,函数将在同⼀个字符串中被保存的位置开始,查找下⼀个标记
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

如果ret为空指针,strtok就会返回空指针。

#include<stdio.h>
#include<string.h>
int main()
{
  const char* sep = "@.";
  char email[] = "zhangpenwei@bitejiuyeke.com";
  char* ret = strtok(email, sep);
  printf("%s\n", email);
  ret = strtok(NULL, sep);
  printf("%s\n", ret);
  ret = strtok(NULL, sep);
  printf("%s\n", ret);
  ret = strtok(NULL, sep);
  printf("%s\n", ret);
  return 0;
}


这样就可以不需要知道email有多少个分割符。

#include<stdio.h>
#include<string.h>
int main()
{
  const char* sep = "@.";
  char email[] = "zhangpenwei@bitejiuyeke.com";
  char* ret = NULL;
  for (ret = strtok(email, sep); ret != NULL; ret = strtok(NULL, sep))
  {
    printf("%s\n", ret);
  }
    return 0;
}


  • strerror函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
  • errno是C语言设置的一个全局的错误码存放的的变量。
#include<stdio.h>
#include<string.h>
#include<errno.h>
int main()
{
  int i = 0;
  for (i = 0; i <= 10; i++)
  {
    printf("%s\n", strerror(i));
  }
  return 0;
}

strerror的使用

有了strerror,我们就可以明确地知道错误信息是什么。

#include<stdio.h>
#include<string.h>
#include<errno.h>
int main()
{
  FILE* pf = fopen("test.txt", "r");
  if (pf == NULL)
  {
    printf("%s\n", strerror(errno));
    return 1;
  }
  else
    //
  return 0;
}

目录
相关文章
|
C语言 Python
字符函数和字符串函数(下)
字符函数和字符串函数(下)
65 0
字符函数和字符串函数(下)
|
C语言
字符函数和字符串函数(上)
字符函数和字符串函数
|
C语言
字符函数和字符串函数(下)
字符函数和字符串函数(下)
|
C语言
字符函数和字符串函数
字符函数和字符串函数
74 0
|
C语言
详解字符函数和字符串函数-2
详解字符函数和字符串函数
57 0
详解字符函数和字符串函数-1
详解字符函数和字符串函数
52 0
|
编译器 C语言 Python
字符函数和字符串函数(上)
字符函数和字符串函数(上)
61 0
|
存储 安全
常用的字符函数和字符串函数
常用的字符函数和字符串函数
104 0