【C语言】字符串和内存函数的介绍 -- 详解

简介: 【C语言】字符串和内存函数的介绍 -- 详解

重点介绍处理字符和字符串的库函数的使用和注意事项。

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。字符串常量适用于那些对它不做修改的字符串函数。


一、求字符串长度⚪strlen

  • 字符串以 '\0' 作为结束标志,strlen 函数返回的是在字符串中 '\0' 前面出现的字符个数不包含 '\0' )
  • 参数指向的字符串必须要以 '\0' 结束。
  • 易错点):注意函数的返回值为 size_t,是无符号(unsigned)的。

strlen - C++ Reference (cplusplus.com)

⚪【模拟实现】(三种不同方法)

#include <stdio.h>
 
// 1、计数器方式
size_t my_strlen(const char* str)
{
  size_t count = 0;
  while (*str)
  {
    count++;
    str++;
  }
  return count;
}
 
// 2、不能创建临时变量计数器
size_t my_strlen(const char* str) 
{ 
    if(*str == '\0')
    {
        return 0;
    }
    else 
    {
        return 1 + my_strlen(str+1);
    }
}
 
// 3、指针-指针的方式
size_t my_strlen(char* str) 
{
    char *p = str; 
    while(*p != '\0' ) 
    {
        p++;
    } 
    return p-str; 
}
 
int main()
{
  char arr[] = "hello world";
  size_t count = my_strlen(arr);
  printf("%zu\n", count);
  return 0;
}


二、长度不受限制的字符串函数

1、strcpy

Copies the C string pointed by source into the array pointed by destination, including the terminating null character (and stopping at that point).

  • 源字符串 src 必须'\0' 结束
  • 会将源字符串 src 中的 '\0' 拷贝到目标空间 dest。
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变,即目标空间 dest 不可以被 const 声明

strcpy - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
char* my_strcpy(char* str2, const char* str1)
{
  assert(str1 && str2);
  char* ret = str2;
  while (*str2++ = *str1++)
  {
    ;
  }
  return ret;
}
 
int main()
{
  char s1[] = "hello world";
  char s2[20] = { 0 };
  char* ret = my_strcpy(s2, s1);
  printf("%s\n", ret);
  return 0;
}


2、strcat

Appends a copy of the source string to the destination string. The terminating null character in destination is overwritten by the fifirst character of source, and a null-character is included at the end of the new string formed by the concatenation of both in destination.

  • 源字符串 src 必须'\0' 结束
  • 将源字符串 src 中的 '\0' 一同拷贝到目标空间 dest ,并删除 *dest 原来末尾的 '\0'
  • 目标空间必须有足够大,能容纳下源字符串的内容。
  • 目标空间必须可修改,即目标空间 dest 不可以被 const 声明

strcat - C++ Reference (cplusplus.com)

🔺字符串自己给自己追加,会如何?

       当使用 strcat 函数将一个字符串追加到自身时,可能会导致未定义的行为。strcat 函数的工作原理是在源字符串的结尾处追加目标字符串的内容,并在结尾加上空字符 '\0'。当源字符串和目标字符串是同一个字符串时,追加操作会导致源字符串的内容被破坏,因为在追加过程中,源字符串的内容会被覆盖,最终结果会是一个不可预测的字符串。因为根据不同的编译器和库的版本,strcat 函数在某些情况下可能不会导致未定义行为。但是将一个字符串追加到自身仍然是一个不好的编程实践,因为它容易引发错误和混乱。

       因此,不推荐使用 strcat 函数将字符串追加到自身。如果需要将一个字符串复制到另一个字符串末尾,可以使用 strcpy 函数进行复制操作。

【模拟实现】

#include <stdio.h>
#include <assert.h>
 
char* my_strcat(char* dest, const char* src)
{
  char* tmp = dest;
  assert(dest && src);
  while (*dest)
  {
    dest++;
  }
  while (*dest = *src)
  {
    dest++;
    src++;
  }
  return tmp;
}
 
int main()
{
  char s1[20] = "hello";
  char s2[] = " world";
  char* ret = my_strcat(s1, s2);
  printf("%s\n", ret);
  return 0;
}


3、strcmp

This function starts comparing the fifirst character of each string. If they are equal to each other, it continues with the following pairs until the characters diffffer or until a terminating null-character is reached.

标准规定

  • 第一个字符串大于第二个字符串,则返回大于 0 的数字
  • 第一个字符串等于第二个字符串,则返回 0
  • 第一个字符串小于第二个字符串,则返回小于 0 的数字

strcmp - C++ Reference (cplusplus.com)

🔺那么如何判断两个字符串?

       返回值只需要满足要求即可,比如大于 0 的数字,不一定是1,只需满足条件即可。

strcmp 函数的比较是基于字符的 ASCII 码进行的。它从两个字符串的第一个字符开始逐个比较,直至找到不相等的字符或者其中一个字符串的结束符 '\0'。在比较的时候,它会将两个字符的 ASCII 码进行减法运算,返回结果作为比较的结果。

       需要注意的是,strcmp 函数是区分大小写的。也就是说,大写字母和小写字母被认为是不同的字符。如果需要不区分大小写的字符串比较,可以使用 strcasecmp 函数(在某些编程环境中可能被称为_stricmp)。

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
int my_strcmp(const char* str1, const char* str2)
{
  assert(str1 && str2);
  while (*str1 == *str2)
  {
    if (*str1 == '\0')
    {
      return 0;
    }
    str1++;
    str2++;
  }
  return (*str1 - *str2);
}
 
int main()
{
  char s1[] = "abcdef";
  char s2[] = "abcq";
  int ret = my_strcmp(s1, s2);
  if (ret > 0)
  {
    printf(">\n");
  }
  else if (ret == 0)
  {
    printf("=\n");
  }
  else
  {
    printf("<\n");
  }
  return 0;
}

注意:根据编译器的不同,返回的结果也不同。

VS2019 中,大于返回 1,等于返回 0,小于返回 -1。但在 Linux-gcc 中,大于返回正数,等于返回0,小于返回负数。

// 推荐
if(strcmp(p1, p2) > 0)
{
    printf("p1 > p2");
}
else if(strcmp(p1, p2 == 0))
{
    printf("p1 == p2");
}
else if(strcmp(p1, p2) < -1)
{
    printf("p1 < p2");
}
 
// 不推荐
if(strcmp(p1, p2) == 1)
{
    printf("p1 > p2");
}
else if(strcmp(p1, p2 == 0))
{
    printf("p1 == p2");
} else if(strcmp(p1, p2) == -1)
{
    printf("p1 < p2");
}

三、长度受限制的字符串函数介绍

1、strncpy

Copies the fifirst num characters of source to destination. If the end of the source C string (which is signaled by a null-character) is found before num characters have been copied, destination is padded with zeros until a total of num characters have been written to it.

  • 拷贝 count 个字符从源字符串到目标空间。
  • 如果源字符串的长度小于 count,则拷贝完源字符串之后,在目标的后边追加 0直到 count 
  • dest 和 src 不应该重叠(重叠时可以用更安全的 memmove 替代)。
  • 目标空间 dest 必须足够大,以确保能够存放源字符串。
  • 目标空间 dest 必须可变,即目标空间 dest 不可以被 const 声明

strncpy - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
char* my_strncpy(char* dest, const char* src, size_t count)
{
  assert(dest && src);
  char* cur = dest;
  while (count--)
  {
    if ((*dest++ = *src++) == '\0')
    {
      break;
    }
  }
 
  if (count != 0)
  {
    while (count--)
    {
      *dest++ = '\0';
    }
  }
  return cur;
}
 
int main()
{
  char s1[20] = { 0 };
  char s2[] = "hello world";
  int sz = sizeof(s2) / sizeof(s2[0]);
  printf("%s\n", my_strncpy(s1, s2, sz));
  return 0;
}


2、strncat

Appends the fifirst num characters of source to destination, plus a terminating null-character. If the length of the C string in source is less than num, only the content up to the terminating null-character is copied.

  • 如果源字符串的长度小于 count,则只复制 '\0' 之前的内容。

strncat - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
char* my_strncat(char* dest, const char* src, size_t count)
{
    assert(dest && src);
    char* cur = dest;
    while (*dest)
    {
        dest++;
    }
 
    while (count--)
    {
        if ((*dest++ = *src++) == '\0')
        {
            return cur;
        }
    }
    *dest = '\0';
    return cur;
}
 
int main()
{
    char s1[20] = "hello";
    char s2[] = " world";
    size_t sz = sizeof(s2) / sizeof(s2[0]);
    printf("%s\n", my_strncat(s1, s2, sz)); // 从s2中取sz个追加到s1中
  return 0;
}


3、strncmp

【代码演示】

#include <stdio.h>
#include <string.h>
 
int main()
{
    const char* p1 = "abczdef";
    const char* p2 = "abcqwer";
    int ret1 = strncmp(p1, p2, 1);
    int ret2 = strncmp(p1, p2, 4);
    printf("%d %d\n", ret1, ret2);
 
    return 0;
}


四、字符串查找

1、strstr

Returns a pointer to the fifirst occurrence of str2 in str1, or a null pointer if str2 is not part of str1.

  • 返回字符串中首次出现子串的地址。若 str2 是 str1 的子串,则返回 str2 在 str1 中首次出现的地址。如果 str2 不是 str1 的子串,则返回 NULL 。

strstr - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
char* my_strstr(const char* str1, const char* str2)
{
  assert(str1 && str2);
  if (*str2 == '\0')
  {
    return (char*)str1;
  }
  char* cur = (char*)str1;
  char* s1, *s2;
  while (*cur != '\0')
  {
    s1 = cur;
    s2 = (char*)str2;
 
    while (*s1 && *s2 && (*s1 == *s2))
    {
      s1++;
      s2++;
    }
    if (*s2 == '\0')
    {
      return cur;
    }
    cur++;
  }
  return NULL;
}
 
int main()
{
  char s1[] = "abbcde";
  char s2[] = "bcd";
  char s3[] = "abcd";
  char* ret1 = my_strstr(s1, s2);
  char* ret2 = my_strstr(s1, s3);
  if (ret1 == NULL)
  {
    printf("未找到匹配的子串!\n");
  }
  else
  {
    printf("%s\n", ret1);
  }
  if (ret2 == NULL)
  {
    printf("未找到匹配的子串!\n");
  }
  else
  {
    printf("%s\n", ret2);
  }
  return 0;
}


2、strtok

  • sep(delimit) 参数是个字符串,定义了用作分隔符的字符集合
  • 第一个参数指定一个字符串,它包含了 0 个或者多个由 sep 字符串中一个或者多个分隔符分割的标记。
  • strtok 函数找到 str 中的下一个标记,并将其用 '\0' 结尾,返回一个指向这个标记的指针。(注:strtok 函数会改变被操作的字符串,所以在使用 strtok 函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok 函数的第一个参数不为 NULL ,函数将找到 str 中第一个标记,strtok 函数将保存它在字符串中的位置。
  • strtok 函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

strtok - C++ Reference (cplusplus.com)

注意strtok 会破坏原字符串,分割后原字符串保留第一个分割符前的字符。

【代码演示】

#include <stdio.h>
#include <string.h>
 
int main()
{
    char arr[] = "3031899646@qq.com";
    printf("原字符串: %s\n", arr);
 
    const char* sep = "@."; // 创建sep
    char arr1[30];
    char* ret = NULL;
    strcpy(arr1, arr); // 将数据拷贝一份,保留arr数组的内容
 
    // 分行打印切割内容
    for (ret = strtok(arr, sep); ret != NULL; ret = strtok(NULL, sep))
    {
        printf("%s\n", ret);
    }
 
    printf("分割后原字符串被破坏: %s\n", arr); // 分割后原字符串保留第一个分割符前的字符
    return 0;
}


五、错误信息报告⚪strerror

  • 返回错误码,所对应的错误信息。
  • errno 是一个全局的错误码变量。当 C 语言的库函数在执行过程中,发生了错误后就会把对应的错误码赋值到errno中。

strerror - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <string.h>
#include <errno.h>
 
// 错误码   错误信息
// 0 -      No error
// 1 -      Operation not permitted
// 2 -      No such file or directory
//
 
int main()
{
    char* str = strerror(errno);
    printf("%s\n", str);
 
    return 0;
}


六、字符操作

1、字符分类函数

⚪【代码演示】

#include <stdio.h>
#include <ctype.h>
 
int main()
{
    char ch1 = 'a';
    int ret = islower(ch1); // 判断ch1是否为小写 -- 非0为真
    printf("%d\n", ret);
 
    char ch2 = 'B';
    int res = islower(ch2); // 判断ch2是否为小写 -- 0为假
    printf("%d\n", res);
 
    return 0;
}

注意:需引入头文件 ctype.h 头文件。


2、字符转换

int tolower ( int c ); 
int toupper ( int c );

⚪【代码演示】

#include <stdio.h>
 
int main()
{
    char ch = tolower('Q'); // 大写转小写
    putchar(ch);
 
    return 0;
}


七、内存操作函数

1、memcpy

  • 函数 memcpy src 的位置开始向后复制 count 个字节的数据到 dest 的内存位置。
  • 这个函数在遇到 '\0' 的时候并不会停下来
  • 如果 src dest 有任何的重叠,复制的结果都是未定义的。

memcpy - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
void* my_memcpy(void* dest, const void* src, size_t count)
{
  assert(dest && src);
  void* ret = dest;
  while (count--)
  {
    *(char*)dest = *(char*)src;
    dest = (char*)dest + 1;
    src = (char*)src + 1;
  }
  return ret;
}
 
int main()
{
  char s1[] = "abcdefgh";
  char s2[20] = "xxxxxxxxxx";
  my_memcpy(s2, s1, 5);
  printf("%s\n", s2);
  return 0;
}

⚪【代码演示】

// 拷贝结构体
#include <stdio.h>
#include <string.h>
 
struct S
{
    char name[20];
    int age;
};
 
int main()
{
    struct S arr3[] = { {"张三", 20}, {"李四", 30} };
    struct S arr4[3] = { 0 };
    memcpy(arr4, arr3, sizeof(arr3));
 
    return 0;
}


2、memmove

  • memcpy 的差别就是 memmove 函数处理的源内存块和目标内存块是可以重叠的
  • 如果源空间和目标空间出现重叠,就得使用 memmove 函数处理。

C语言标准要求:

memcpy 用来处理不重叠的内存拷贝,而 memmove 用来处理重叠内存的拷贝

memmove - C++ Reference (cplusplus.com)

⚪【模拟实现】

#include <stdio.h>
#include <assert.h>
 
void* my_memmove(void* dest, const void* src, size_t count)
{
  assert(dest && src);
  void* ret = dest;
 
  //从前->后
  if (dest <= src)
  {
    while (count--)
    {
      *(char*)dest = *(char*)src;
      dest = (char*)dest + 1;
      src = (char*)src + 1;
    }
  }
 
  //从后->前
  else
  {
    dest = (char*)dest + count - 1;
    src = (char*)src + count - 1;
    while (count--)
    {
      *(char*)dest = *(char*)src;
      dest = (char*)dest - 1;
      src = (char*)src - 1;
    }
  }
  return ret;
}
 
int main()
{
  char arr[] = "abcdefgh";
  my_memmove(arr, arr + 3, 2);
  printf("%s\n", arr);
  return 0;
}


3、memset

⚪【代码实现】

#include <stdio.h>
#include <string.h>
 
int main()
{
    int arr[10] = { 0 };
    memset(arr, 1, 20); // 将前20个字节全部设置为1
 
    return 0;
}


4、memcmp

  • 比较从 buf1 和 buf2 指针开始的 count 个字节。

注意memcmp 不同于 strcmp,memcmp 遇到 '\0' 不会停止比较。

memcmp - C++ Reference (cplusplus.com)

⚪【代码演示】

#include <stdio.h>
#include <string.h>
 
int main()
{
    float arr1[] = { 1.0, 2.0, 3.0, 4.0 };
    float arr2[] = { 1.0, 3.0 };
    int ret = memcmp(arr1, arr2, 8); // arr1是否比arr2大,比较8个字节
    printf("%d\n", ret);
 
    return 0;
}

相关文章
|
3天前
|
程序员 C语言 C++
【C语言基础】:动态内存管理(含经典笔试题分析)-2
【C语言基础】:动态内存管理(含经典笔试题分析)
|
3天前
|
程序员 编译器 C语言
【C语言基础】:动态内存管理(含经典笔试题分析)-1
【C语言基础】:动态内存管理(含经典笔试题分析)
|
3天前
|
存储 小程序 编译器
【C语言基础】:数据在内存中的存储
【C语言基础】:数据在内存中的存储
|
3天前
|
安全 C语言
【C语言基础】:内存操作函数
【C语言基础】:内存操作函数
|
3天前
|
编译器 C语言 C++
【C语言基础】:字符函数和字符串函数-2
【C语言基础】:字符函数和字符串函数
|
3天前
|
C语言
【C语言基础】:字符函数和字符串函数-1
【C语言基础】:字符函数和字符串函数
TU^
|
3天前
|
编译器 程序员 Serverless
C语言之函数
C语言之函数
TU^
4 0
TU^
|
3天前
|
机器学习/深度学习 C语言
C语言之函数递归
C语言之函数递归
TU^
6 1
|
1月前
|
存储 编译器 C语言
在C语言中的数组和字符串
在C语言中的数组和字符串
|
10月前
|
存储 机器学习/深度学习 Linux
【C语言】语言篇——数组和字符串
【C语言】语言篇——数组和字符串
41 0