【C语言】带你深入剖析字符串相关知识(详细讲解+代码展示)

简介: 字符串,一个C语言中的难点,其包含很多零碎知识,以及我们在算法题中会经常遇见,在这里我们会深入浅出的讲解字符串相关知识,还有以及gets()、fgets()、puts()、fputs()、strlen()等一些函数知识...........

 哈喽大家好,今天我们来为大家介绍字符串的相关知识;在C语言的学习中,字符串的知识与数组会紧密结合。所以,个人建议在大家掌握数组的知识后食用最佳。

学习数组的跳转链接:https://developer.aliyun.com/article/1003455?spm=a2c6h.26396819.creator-center.10.27df3e18gV6odC

下面我们正式来讲解一下字符串的知识吧!

字符数组与字符串区别

我们首先要知道的是,在C语言中是没有字符串这种数据类型的,所以,在这里我们所提到的字符串实际上是使用空字符 \0 结尾的一维字符数组。因此,\0 是用于标记字符串的结束。

需要注意的是,字符串一定是一个char的数组,但是char的数组未必是字符串;如果char数组没有以数字0结尾,那么就不是一个字符串,只是普通字符数组;所以字符串是一种特殊的 char 的数组。

其字符串在内存中的表示如图所示:

字符串的内存表示.png

空字符(Null character)又称结束符,缩写 NUL,是一个数值为 0 的控制字符,\0 是转义字符,意思是告诉编译器,这不是字符 0,而是空字符。

关于字符 ‘\0’ : '\0' 就是8位的00000000它于 0 等价,以其结尾的char数组就是一个字符串。并且,我们并不需要把 null 字符放在字符串常量的末尾。因为C 编译器会在初始化数组时,会自动把 \0 放在字符串的末尾。

下面我们看下这段知识与实际应用对应的代码吧:

#include <stdio.h>
int main()
{
  //以'\0'('\0'就是数字0)结尾的字符数组是字符串
  char c2[] = { 'c', ' ', 'p', 'r', 'o', '\0'}; 
  printf("c2 = %s\n", c2);
  //字符串处理以'\0'(数字0)作为结束符,后面的'h', 'l', 'l', 'e', 'o'不会输出
  char c3[] = { 'c', ' ', 'p', 'r', 'o',  '\0', 'h', 'l', 'l', 'e', 'o', '\0'};
  printf("c3 = %s\n", c3);
  return 0;
}

image.gif

所以对于字符串来说,我们就将其看做一个特殊的数组来对待即可,不要将其想象的太过复杂了。

字符串的初始化

因为在C语言中没有字符串类型,所以我们使用字符数组去进行实现字符串的初始化。

1.不设定长度初始化

如果我们不设定字符串长度但进行初始化时,这时结尾将不会去自动添加0结束符,也就是你初始化的长度为多少,那么结果的长度就是多少。

例如:

char buf[] = { 'a', 'b', 'c' };

image.gif

2. 指定长度初始化

如果我们在初始化数组时已经为数组指定长度了,那么我们后面没有赋值的元素,将会被自动补0。

就比如:

char buf2[100] = { 'a', 'b', 'c' };
char buf[1000]={“hello”};

image.gif

两个数组没有赋值的元素将会被自动补0。

3.所有元素赋0

如果我们在初始化的时候想要将一个字符数组里面的元素全部初始化为0,那么我们就不用再去一个一个的输入了,这时我们只需要一个0即可,例如:

char buf3[100] = { 0 };

image.gif

就是将buf3数组里的元素全部初始化为0。

总结代码:

#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  //不指定长度, 没有0结束符,有多少个元素就有多长
  char buf[] = { 'a', 'b', 'c' };
  printf("buf = %s\n", buf);  //乱码
  //指定长度,后面没有赋值的元素,自动补0
  char buf2[100] = { 'a', 'b', 'c' };
  printf("buf2 = %s\n", buf2);
  //所有元素赋值为0
  char buf3[100] = { 0 };
  return 0;
}

image.gif

注意:

1. 如果我们在初始化数组时,将中间的一个元素设置为了 "\0" 那么这个元素后面的元素将不会被输出,因为字符串遇到 "\0" 的时候会自动结束。

举例:

#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  char buf5[50] = { '1', 'a', 'b', '0', '7' };
  printf("buf5 = %s\n", buf5);
  char buf6[50] = { '1', 'a', 'b', 0, '7' };
  printf("buf6 = %s\n", buf6);
  char buf7[50] = { '1', 'a', 'b', '\0', '7' };
  printf("buf7 = %s\n", buf7);
  return 0;
}

image.gif

运行结果:

图片1.png

通过上面的例子,不难看出,字符串在输出的时候,遇见 0(‘\0’)会自动结束,其后面的元素也就无法输出了。

2. 我们在使用'\0'时后面最好不要连着数字,因为有可能几个数字连起来刚好是一个转义字符

例如:

#include <stdio.h>
// C语言没有字符串类型,通过字符数组模拟
int main()
{
  char str[] = "\012abc";
  printf("str == %s\n", str);
  return 0;
}

image.gif

'\ddd'是八进制字义字符,'\xdd'是十六进制转移字符;这里\012就相当于\n;所以就不难看出我们上题的输出结果了。

结果:

图片2.png

字符串的输入输出

由于字符串采用了'\0'标志,所以字符串的输入输出将变得简单方便。

#include <stdio.h>
int main()
{
  char str[100];
  printf("input string1 : \n") ;
  scanf("%s", str) ;
  printf("output:%s\n", str) ;
  return 0;
}

image.gif

看上段代码,此代码也就是从键盘输入一个字符串并打印出来;但是呢,这段代码会出现一个问题, 这个问题就出现在这句语句上:scanf("%s", str); 因为scanf("%s", str);默认以空格分隔 ;也就是如果我们输入一串连续的字符串是没问题的,但是如果我们输入的字符串中间是有空格的,那么系统只会识别第一个空格前面的部分,并输出。

输出对比:

图片3.png

图片4.png

所以在这里我为大家介绍几个输入输出的函数,以遍大家可以更好的去对字符串进行操作。

gets()

gets()函数的功能是:从标准输入读入字符,并保存到s指定的内存空间,直到出现换行符或读到文件结尾为止。

其应照以下方法应用:

#include <stdio.h>
char *gets(char *s);

image.gif

其中s 表示字符串首地址 ;如果成功的话将会读入的字符串,否则返回NULL 。

在这里我们要分析一下gets(str)与scanf(“%s”,str)的区别:

    1. gets(str)允许输入的字符串含有空格
    2. scanf(“%s”,str)不允许含有空格

    需要注意的是由于scanf()和gets()无法知道字符串s大小,必须遇到换行符或读到文件结尾为止才接收输入,因此容易导致字符数组越界(缓冲区溢出)的情况。我们在平时使用的时候一定要注意所开的空间,以避免出现这种情况。

    fgets()

    fgets()函数的功能是:从指定的文件内读入字符,保存到字符串所指定的内存空间,直到出现换行字符、读到文件结尾或是已读了(最大读取字符串长度-1)个字符为止,最后会自动加上字符 '\0' 作为字符串结束。

    其应照以下方法应用:

    #include <stdio.h>
    char *fgets(char *s, int size, FILE *stream);

    image.gif

    其中: s表示字符串 ; size是指定最大读取字符串的长度; stream:文件指针,如果读键盘输入的字符串,固定写为stdin 。  

    返回值

          成功:成功读取的字符串

          读到文件尾或出错: NULL 。

    fgets()在读取一个用户通过键盘输入的字符串的时候,同时把用户输入的回车也做为字符串的一部分。通过scanf和gets输入一个字符串的时候,不包含结尾的“\n”,但通过fgets结尾多了“\n”。所以fgets()函数是安全的,不会存在缓冲区溢出的问题。

    puts()

    puts()函数的功能是标准设备输出s字符串,并且在输出完成后自动输出一个'\n'

    其应照以下方法应用:

    #include <stdio.h>
    int puts(const char *s);

    image.gif

    其中: s表示字符串首地址 。

    返回值

          成功:非负数

          失败:-1

    fputs()

    fputs()函数的功能是将str所指定的字符串写入到stream指定的文件中字符串结束符'\0'  不写入文件。

    其应照以下方法应用:

    #include <stdio.h>
    int fputs(const char * str, FILE * stream);

    image.gif

     其中 str表示字符串 ; stream表示文件指针如果字符串输出到屏幕,固定写为stdout

    返回值:

          成功:0

          失败:-1

    fputs()是puts()的文件操作版本,只不过fputs()不会自动输出一个'\n'

    strlen()

    strlen()的功能是计算指定指定字符串s的长度不包含字符串结束符‘\0’ 。

    其应照以下方法应用:

    #include <string.h>
    size_t strlen(const char *s);

    image.gif

    其中 s 表示字符串首地址

    返回值

           将返回字符串s的长度,size_t为unsigned int类型

    字符串强化训练

    到这里我们字符串的相关知识也了解的差不多了,这里我们通过一个字符串追加的例子,来为大家强化训练一下字符串相关知识。

    在这个例子中,需要我们对两个字符数组初始化,之后将两个字符数组合并后再输出,也就是将两个字符串合并为一个字符串,也可以理解为将第二个字符串追加到第一个字符串的上面。

    具体思路:

    我们在试图解决这个题目的时候,要合理的去运用数组的知识,毕竟我们前面提到了,字符串就是一个特殊的数组。首先,我们可以设出三个数组,其中两个已经完成初始化,有一个作为我们最终的输出数组。对于两个初始化的数组,我们将第一个数组中的每个元素,利用循环,将其搬运到最终数组上,知道遇到 '\0' 时切换到第二个数组,同理,这样最后我们只需要按顺序输出第三个数组里面的元素即可。

    其代码:

    #include <stdio.h>
    int main()
    {
      char str1[] = "abcdef";
      char str2[] = "123456";
      char dst[100];
      int i = 0;
      while (str1[i] != 0)  //判断第一个字符串是否到结尾 
      {
        dst[i] = str1[i]; //将第一个字符串的元素一一对应到最终数组上 
        i++;
      }
      int j = 0;
      while (str2[j] != 0)  //判断第二个字符串是否到结尾 
      {
        dst[i + j] = str2[j]; //将第二个字符串的元素一一对应到最终数组上 
        j++;
      }
      dst[i + j] = 0;   //字符串结束符
      printf("dst = %s\n", dst);  //直接输即可 
      return 0;
    }

    image.gif

    运行结果:

    图片5.png

    好啦,到了这里我们字符串相关知识就讲解的差不多了,希望你可以听懂,当然如果有什么不会的可以随时在评论区提问,我看到后会第一时间解答的。

    目录
    相关文章
    |
    8天前
    |
    存储 数据可视化 C语言
    【C语言】C语言 学生成绩管理系统(源码+报告)【千行代码】【独一无二】
    【C语言】C语言 学生成绩管理系统(源码+报告)【千行代码】【独一无二】
    |
    6天前
    |
    存储 C语言
    【C语言】基础刷题训练4(含全面分析和代码改进示例)
    【C语言】基础刷题训练4(含全面分析和代码改进示例)
    |
    13天前
    |
    人工智能 Rust 安全
    DARPA计划“消灭”C语言代码
    为了加速软件业向内存安全编程语言的过渡,美国国防高级研究计划局(DARPA)正在推动一个名为TRACTOR的人工智能代码转换工具,可自动将遗留C代码转换为Rust,以根治内存安全问题。TRACTOR是TRanslating All C TO Rust的缩写,即“将所有C语言代码转换为Rust语言”。
    DARPA计划“消灭”C语言代码
    |
    18小时前
    |
    C语言
    【C语言】字符串及其函数速览
    【C语言】字符串及其函数速览
    11 4
    |
    21小时前
    |
    C语言
    【C语言篇】字符和字符串以及内存函数详细介绍与模拟实现(下篇)
    perror函数打印完参数部分的字符串后,再打印⼀个冒号和⼀个空格,再打印错误信息。
    |
    22小时前
    |
    存储 安全 编译器
    【C语言篇】字符和字符串以及内存函数的详细介绍与模拟实现(上篇)
    当然可以用scanf和printf输入输出,这里在之前【C语言篇】scanf和printf万字超详细介绍(基本加拓展用法)已经讲过了,这里就不再赘述,主要介绍只针对字符的函数.
    |
    6天前
    |
    C语言
    【C语言刷题训练】——第7节(含代码与分析思路)
    【C语言刷题训练】——第7节(含代码与分析思路)
    |
    6天前
    |
    测试技术 C语言 C++
    【C语言刷题训练——6】鹏哥C语言刷题训练营笔记,含代码讲解改进
    【C语言刷题训练——6】鹏哥C语言刷题训练营笔记,含代码讲解改进
    |
    6天前
    |
    存储 C语言
    【C语言】鹏哥C语言刷题训练营——第5节内容笔记(含代码全面分析和改进,讲解)
    【C语言】鹏哥C语言刷题训练营——第5节内容笔记(含代码全面分析和改进,讲解)
    |
    1月前
    |
    安全 C语言
    C语言8 数组与字符串
    C语言8 数组与字符串
    14 0