【C语言】带你深入剖析字符串相关知识(详细讲解+源码展示)

简介: 笔记

字符数组与字符串区别


我们首先要知道的是,在C语言中是没有字符串这种数据类型的,所以,在这里我们所提到的字符串实际上是使用空字符 \0 结尾的一维字符数组。因此,\0 是用于标记字符串的结束。


需要注意的是,字符串一定是一个char的数组,但是char的数组未必是字符串;如果char数组没有以数字0结尾,那么就不是一个字符串,只是普通字符数组;所以字符串是一种特殊的 char 的数组。


其字符串在内存中的表示如图所示:

30.png



空字符(Null character)又称结束符,缩写 NUL,是一个数值为 0 的控制字符,\0 是转义字符,意思是告诉编译器,这不是字符 0,而是空字符。


关于字符 ‘\0’ : '\0' 就是8位的00000000它于 0 等价,以其结尾的char数组就是一个字符串。并且,我们并不需要把 null 字符放在字符串常量的末尾。因为C 编译器会在初始化数组时,会自动把 \0 放在字符串的末尾。


下面我们看下这段知识与实际应用对应的代码吧:

#include <stdio.h>
int main()
{
  //以'\0'('\0'就是数字0)结尾的字符数组是字符串
  char c2[] = { 'c', ' ', 'p', 'r', 'o', '\0'}; 
  printf("c2 = %s\n", c2);
  //字符串处理以'\0'(数字0)作为结束符,后面的'h', 'l', 'l', 'e', 'o'不会输出
  char c3[] = { 'c', ' ', 'p', 'r', 'o',  '\0', 'h', 'l', 'l', 'e', 'o', '\0'};
  printf("c3 = %s\n", c3);
  return 0;
}


所以对于字符串来说,我们就将其看做一个特殊的数组来对待即可,不要将其想象的太过复杂了。


字符串的初始化


因为在C语言中没有字符串类型,所以我们使用字符数组去进行实现字符串的初始化。


1.不设定长度初始化

如果我们不设定字符串长度但进行初始化时,这时结尾将不会去自动添加0结束符,也就是你初始化的长度为多少,那么结果的长度就是多少。


例如:

char buf[] = { 'a', 'b', 'c' };

2. 指定长度初始化

如果我们在初始化数组时已经为数组指定长度了,那么我们后面没有赋值的元素,将会被自动补0。


就比如:

char buf2[100] = { 'a', 'b', 'c' };
char buf[1000]={“hello”};

两个数组没有赋值的元素将会被自动补0。


3.所有元素赋0

如果我们在初始化的时候想要将一个字符数组里面的元素全部初始化为0,那么我们就不用再去一个一个的输入了,这时我们只需要一个0即可,例如:

char buf3[100] = { 0 };

就是将buf3数组里的元素全部初始化为0。


总结代码:


#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  //不指定长度, 没有0结束符,有多少个元素就有多长
  char buf[] = { 'a', 'b', 'c' };
  printf("buf = %s\n", buf);  //乱码
  //指定长度,后面没有赋值的元素,自动补0
  char buf2[100] = { 'a', 'b', 'c' };
  printf("buf2 = %s\n", buf2);
  //所有元素赋值为0
  char buf3[100] = { 0 };
  return 0;
}


注意:

1. 如果我们在初始化数组时,将中间的一个元素设置为了 "\0" 那么这个元素后面的元素将不会被输出,因为字符串遇到 "\0" 的时候会自动结束。


举例:


#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  char buf5[50] = { '1', 'a', 'b', '0', '7' };
  printf("buf5 = %s\n", buf5);
  char buf6[50] = { '1', 'a', 'b', 0, '7' };
  printf("buf6 = %s\n", buf6);
  char buf7[50] = { '1', 'a', 'b', '\0', '7' };
  printf("buf7 = %s\n", buf7);
  return 0;
}

运行结果:

31.png


通过上面的例子,不难看出,字符串在输出的时候,遇见 0(‘\0’)会自动结束,其后面的元素也就无法输出了。


2. 我们在使用'\0'时后面最好不要连着数字,因为有可能几个数字连起来刚好是一个转义字符


例如:

#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  char str[] = "\012abc";
  printf("str == %s\n", str);
  return 0;
}

'\ddd'是八进制字义字符,'\xdd'是十六进制转移字符;这里\012就相当于\n;所以就不难看出我们上题的输出结果了。


结果:

32.png



字符串的输入输出


由于字符串采用了'\0'标志,所以字符串的输入输出将变得简单方便。

#include <stdio.h>
int main()
{
  char str[100];
  printf("input string1 : \n") ;
  scanf("%s", str) ;
  printf("output:%s\n", str) ;
  return 0;
}

看上段代码,此代码也就是从键盘输入一个字符串并打印出来;但是呢,这段代码会出现一个问题, 这个问题就出现在这句语句上:scanf("%s", str); 因为scanf("%s", str);默认以空格分隔 ;也就是如果我们输入一串连续的字符串是没问题的,但是如果我们输入的字符串中间是有空格的,那么系统只会识别第一个空格前面的部分,并输出。


输出对比:


33.png34.png




所以在这里我为大家介绍几个输入输出的函数,以遍大家可以更好的去对字符串进行操作。


gets()

gets()函数的功能是:从标准输入读入字符,并保存到s指定的内存空间,直到出现换行符或读到文件结尾为止。


其应照以下方法应用:


#include <stdio.h>
char *gets(char *s);

其中s 表示字符串首地址 ;如果成功的话将会读入的字符串,否则返回NULL 。


在这里我们要分析一下gets(str)与scanf(“%s”,str)的区别:


gets(str)允许输入的字符串含有空格

scanf(“%s”,str)不允许含有空格

需要注意的是由于scanf()和gets()无法知道字符串s大小,必须遇到换行符或读到文件结尾为止才接收输入,因此容易导致字符数组越界(缓冲区溢出)的情况。我们在平时使用的时候一定要注意所开的空间,以避免出现这种情况。


fgets()

fgets()函数的功能是:从指定的文件内读入字符,保存到字符串所指定的内存空间,直到出现换行字符、读到文件结尾或是已读了(最大读取字符串长度-1)个字符为止,最后会自动加上字符 '\0' 作为字符串结束。


其应照以下方法应用:

#include <stdio.h>
char *fgets(char *s, int size, FILE *stream);

其中: s表示字符串 ; size是指定最大读取字符串的长度; stream:文件指针,如果读键盘输入的字符串,固定写为stdin 。  


返回值:


      成功:成功读取的字符串


      读到文件尾或出错: NULL 。


fgets()在读取一个用户通过键盘输入的字符串的时候,同时把用户输入的回车也做为字符串的一部分。通过scanf和gets输入一个字符串的时候,不包含结尾的“\n”,但通过fgets结尾多了“\n”。所以fgets()函数是安全的,不会存在缓冲区溢出的问题。


puts()

puts()函数的功能是标准设备输出s字符串,并且在输出完成后自动输出一个'\n'。


其应照以下方法应用:


#include <stdio.h>
int puts(const char *s);

其中: s表示字符串首地址 。


返回值:


      成功:非负数


      失败:-1


fputs()

fputs()函数的功能是将str所指定的字符串写入到stream指定的文件中, 字符串结束符 '\0'  不写入文件。


其应照以下方法应用:


#include <stdio.h>
int fputs(const char * str, FILE * stream);

 其中 str表示字符串 ; stream表示文件指针,如果把字符串输出到屏幕,固定写为stdout


返回值:


      成功:0


      失败:-1


fputs()是puts()的文件操作版本,只不过fputs()不会自动输出一个'\n'。


strlen()

strlen()的功能是计算指定指定字符串s的长度,不包含字符串结束符‘\0’ 。


其应照以下方法应用:


#include <string.h>
size_t strlen(const char *s);

其中 s 表示字符串首地址


返回值:


       将返回字符串s的长度,size_t为unsigned int类型


字符串强化训练


到这里我们字符串的相关知识也了解的差不多了,这里我们通过一个字符串追加的例子,来为大家强化训练一下字符串相关知识。


在这个例子中,需要我们对两个字符数组初始化,之后将两个字符数组合并后再输出,也就是将两个字符串合并为一个字符串,也可以理解为将第二个字符串追加到第一个字符串的上面。


具体思路:


我们在试图解决这个题目的时候,要合理的去运用数组的知识,毕竟我们前面提到了,字符串就是一个特殊的数组。首先,我们可以设出三个数组,其中两个已经完成初始化,有一个作为我们最终的输出数组。对于两个初始化的数组,我们将第一个数组中的每个元素,利用循环,将其搬运到最终数组上,知道遇到 '\0' 时切换到第二个数组,同理,这样最后我们只需要按顺序输出第三个数组里面的元素即可。


其代码:

#include <stdio.h>
int main()
{
  char str1[] = "abcdef";
  char str2[] = "123456";
  char dst[100];
  int i = 0;
  while (str1[i] != 0)  //判断第一个字符串是否到结尾 
  {
  dst[i] = str1[i]; //将第一个字符串的元素一一对应到最终数组上 
  i++;
  }
  int j = 0;
  while (str2[j] != 0)  //判断第二个字符串是否到结尾 
  {
  dst[i + j] = str2[j]; //将第二个字符串的元素一一对应到最终数组上 
  j++;
  }
  dst[i + j] = 0;  //字符串结束符
  printf("dst = %s\n", dst);  //直接输即可 
  return 0;
}


运行结果:

35.png



好啦,到了这里我们字符串相关知识就讲解的差不多了,希望你可以听懂,当然如果有什么不会的可以随时在评论区提问,我看到后会第一时间解答的。


相关文章
|
19天前
|
存储 C语言
【C语言篇】深入理解指针3(附转移表源码)
【C语言篇】深入理解指针3(附转移表源码)
30 1
|
19天前
|
C语言 C++
【C语言】解决不同场景字符串问题:巧妙运用字符串函数
【C语言】解决不同场景字符串问题:巧妙运用字符串函数
|
1月前
|
存储 C语言
【C语言基础考研向】10 字符数组初始化及传递和scanf 读取字符串
本文介绍了C语言中字符数组的初始化方法及其在函数间传递的注意事项。字符数组初始化有两种方式:逐个字符赋值或整体初始化字符串。实际工作中常用后者,如`char c[10]=&quot;hello&quot;`。示例代码展示了如何初始化及传递字符数组,并解释了为何未正确添加结束符`\0`会导致乱码。此外,还讨论了`scanf`函数读取字符串时忽略空格和回车的特点。
|
1月前
|
存储 Serverless C语言
【C语言基础考研向】11 gets函数与puts函数及str系列字符串操作函数
本文介绍了C语言中的`gets`和`puts`函数,`gets`用于从标准输入读取字符串直至换行符,并自动添加字符串结束标志`\0`。`puts`则用于向标准输出打印字符串并自动换行。此外,文章还详细讲解了`str`系列字符串操作函数,包括统计字符串长度的`strlen`、复制字符串的`strcpy`、比较字符串的`strcmp`以及拼接字符串的`strcat`。通过示例代码展示了这些函数的具体应用及注意事项。
|
19天前
|
存储 编译器 C语言
【C语言篇】数组和函数的实践:扫雷游戏(附源码)
【C语言篇】数组和函数的实践:扫雷游戏(附源码)
30 0
|
1月前
|
存储 人工智能 C语言
C语言程序设计核心详解 第八章 指针超详细讲解_指针变量_二维数组指针_指向字符串指针
本文详细讲解了C语言中的指针,包括指针变量的定义与引用、指向数组及字符串的指针变量等。首先介绍了指针变量的基本概念和定义格式,随后通过多个示例展示了如何使用指针变量来操作普通变量、数组和字符串。文章还深入探讨了指向函数的指针变量以及指针数组的概念,并解释了空指针的意义和使用场景。通过丰富的代码示例和图形化展示,帮助读者更好地理解和掌握C语言中的指针知识。
|
1月前
|
C语言
C语言 字符串操作函数
本文档详细介绍了多个常用的字符串操作函数,包括 `strlen`、`strcpy`、`strncpy`、`strcat`、`strncat`、`strcmp`、`strncpy`、`sprintf`、`itoa`、`strchr`、`strspn`、`strcspn`、`strstr` 和 `strtok`。每个函数均提供了语法说明、参数解释、返回值描述及示例代码。此外,还给出了部分函数的自实现版本,帮助读者深入理解其工作原理。通过这些函数,可以轻松地进行字符串长度计算、复制、连接、比较等操作。
|
2月前
|
存储 C语言
【C语言】C语言-宾馆客房管理系统(源码+论文)【独一无二】
【C语言】C语言-宾馆客房管理系统(源码+论文)【独一无二】
【C语言】C语言-宾馆客房管理系统(源码+论文)【独一无二】
|
2月前
|
C语言
【C语言】字符串及其函数速览
【C语言】字符串及其函数速览
28 4
|
2月前
|
算法 编译器 C语言
【C语言篇】猜数字游戏(赋源码)
rand函数会返回⼀个伪随机数,这个随机数的范围是在0~RAND_MAX之间,这个RAND_MAX的⼤⼩是依赖编译器上实现的,但是⼤部分编译器上是32767。
91 1