字符串和内存函数(1)

简介: 字符串和内存函数(1)


1. 前言

C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串或者字符数组中;字符串常量适用于那些对它不做修改的字符串函数。

2. 函数介绍

2.1 strlen

size_t strlen(const char* str);

  • 字符串以 ‘\0’ 作为结束标志,strlen函数返回的是在字符串中 ‘\0’ 前面出现的字符个数(不包含 ‘\0’)。
  • 参数指向的字符串必须要以 ‘\0’ 结束。
  • 注意函数的返回值为size_t,是无符号的。(易错)
#include <stdio.h>
#include <string.h>
int main()
{
  if (strlen("abc") - strlen("abcdef") > 0)
  {
    printf("大于\n");
  }
  else
  {
    printf("小于等于\n");
  }
  return 0;
}

以上代码的结果是大于,这就是因为strlen返回的是无符号的整型,所以应该这样写:

#include <stdio.h>
#include <string.h>
int main()
{
  if ((int)strlen("abc") - (int)strlen("abcdef") > 0)
  {
    printf("大于\n");
  }
  else
  {
    printf("小于等于\n");
  }
  return 0;
}
#include <stdio.h>
#include <string.h>
int main()
{
  if (strlen("abc") > strlen("abcdef"))
  {
    printf("大于\n");
  }
  else
  {
    printf("小于等于\n");
  }
  return 0;
}

以上两个代码的结果就是小于等于。

我们再来复习一下strlen函数的模拟实现:

#include <stdio.h>
//1. 计数器
size_t my_strlen(const char* str)
{
  int count = 0;
  while (*str != '\0')
  {
    count++;
    str++;
  }
  return count;
}
//2. 指针-指针
//3. 递归的方法
int main()
{
  size_t sz = my_strlen("abc");
  printf("%u\n", sz);//3
  return 0;
}

另外两种方法如果不清楚,可以看之前的指针初阶(1)。

2.2 strcpy

char* strcpy(char* destination, const char* source);

  • Copies the C string pointed by source into the array pointed by destination, including the terminating null character (and stopping at that point).
  • 源字符串必须以 ‘\0’ 结束。
  • 会将源字符串中的 ‘\0’ 拷贝到目标空间。
  • 目标空间必须足够大,以确保能存放源字符串。
  • 目标空间必须可变。
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = { 0 };
  //char* arr1 = "xxxxxxxxxx";//err  常量字符串不能被修改
  //char arr2[] = "hello bit";
  char arr2[6] = { 'a', 'b', 'c', 'd', 'e', '\0' };
  strcpy(arr1, arr2);
  printf("%s\n", arr1);//abcde
  return 0;
}

我们再来看一下strcpy函数的模拟实现:

#include <stdio.h>
#include <assert.h>
//char* my_strcpy(char* dest, const char* src)
//{
//  char* ret = dest;
//  assert(dest != NULL);
//  assert(src != NULL);
//
//  while (*src != '\0')
//  {
//    *dest = *src;
//    dest++;
//    src++;
//  }
//
//  *dest = *src;//\0
//
//  return ret;
//}
char* my_strcpy(char* dest, const char* src)
{
  char* ret = dest;
  assert(dest != NULL);
  assert(src != NULL);
  while (*dest++ = *src++)
  {
    ;
  }
  return ret;
}
int main()
{
  char arr1[20] = "hello world";
  char arr2[] = "xxxxx";
  //printf("%s\n", my_strcpy(arr1, arr2));
  my_strcpy(arr1 + 6, arr2);
  printf("%s\n", arr1);//hello xxxxx
  return 0;
}

2.3 strcat

char* strcat(char* destination, const char* source);

  • Appends a copy of the source string to the destination string. The terminating null character in destination is overwritten by the first character of source, and a null-character is included at the end of the new string formed by the concatenation of both in destination.
  • 源字符串必须以 ‘\0’ 结束。
  • 目标字符串也必须以 ‘\0’ 结束。
  • 目标空间必须有足够的大,能容纳下源字符串的内容。
  • 目标空间必须可修改。
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = "hello";
  char arr2[] = "world";
  strcat(arr1, arr2);
  printf("%s\n", arr1);//helloworld
  return 0;
}

以下是对strcat函数的模拟实现:

#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* src)
{
  assert(dest && src);
  char* ret = dest;
  //1. 找目标空间中的\0
  while (*dest)
  {
    dest++;
  }
  while (*dest++ = *src++)
  {
    ;
  }
  return ret;
}
int main()
{
  char arr1[20] = "hello ";
  char arr2[] = "world";
  my_strcat(arr1, arr2);
  printf("%s\n", arr1);//hello world
  return 0;
}

我们思考一个问题:字符串能自己给自己追加吗?

答:strcat 最好不要自己给自己追加!

#include <stdio.h>
#include <assert.h>
char* my_strcat(char* dest, const char* src)
{
  assert(dest && src);
  char* ret = dest;
  //1. 找目标空间中的\0
  while (*dest)
  {
    dest++;
  }
  while (*dest++ = *src++)
  {
    ;
  }
  return ret;
}
int main()
{
  char arr1[20] = "hello";
  my_strcat(arr1, arr1);
  printf("%s\n", arr1);
  return 0;
}

dest 和 src 中一开始存的都是 ‘h’ 的地址,之后 dest 会找到 ‘\0’ 的地址,接着通过 *dest = *src,把 ‘\0’ 替换成 ‘h’,但是这样之后 src 就找不到 ‘\0’ 了,就会进入死循环。因此,strcat 最好不要自己给自己追加!

2.4 strcmp

int strcmp(const char* str1, const char* str2);

  • This function starts comparing the first character of each string. If they are equal to each other, it continues with the following pairs until the characters differ or until a terminating null-character is reached.
  • 标准规定:
  • 第一个字符串大于第二个字符串,则返回大于0的数字
  • 第一个字符串等于第二个字符串,则返回0
  • 第一个字符串小于第二个字符串,则返回小于0的数字
//VS
//> 1
//= 0
//< -1
#include <stdio.h>
#include <string.h>
int main()
{
  int ret = strcmp("abcdef", "abq");
  printf("%d\n", ret);//-1
  return 0;
}

strcmp的模拟实现:

#include <stdio.h>
#include <assert.h>
//int my_strcmp(const char* str1, const char* str2)
//{
//  assert(str1 && str2);
//  
//  while (*str1 == *str2)
//  {
//    if ('\0' == *str1)
//    {
//      return 0;
//    }
//    
//    str1++;
//    str2++;
//  }
//
//  if (*str1 > *str2)
//  {
//    return 1;
//  }
//  else
//  {
//    return -1;
//  }
//
//}
int my_strcmp(const char* str1, const char* str2)
{
  assert(str1 && str2);
  while (*str1 == *str2)
  {
    if ('\0' == *str1)
    {
      return 0;
    }
    str1++;
    str2++;
  }
  return (*str1 - *str2);
}
int main()
{
  int ret = my_strcmp("bbq", "bcq");
  if (ret > 0)
  {
    printf(">\n");
  }
  printf("%d\n", ret);//-1
  return 0;
}


2.5 strncpy

char* strncpy(char* destination, const char* source, size_t num);

  • Copies the first num characters of source to destination. If the end of the source C string (which is signaled by a null-character) is found before num characters have been copied,destination is padded with zeros until a total of num characters have been written to it.
  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = "abcdef";
  //char arr2[] = "xxxxxxxxxxxxx";
  //strncpy(arr1, arr2, 3);
  //printf("%s\n", arr1);//xxxdef
  char arr2[] = "xxx";
  strncpy(arr1, arr2, 5);
  printf("%s\n", arr1);//xxx
  return 0;
}

2.6 strncat

char* strncat(char* destination, const char* source, size_t num);

  • Appends the first num characters of source to destination, plus a terminating null-character.
  • If the length of the C string in source is less than num, only the content up to the terminating null-character is copied.
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = "abcdef\0yyyyyyyyyyy";
  char arr2[] = "xxx";
  strncat(arr1, arr2, 5);
  return 0;
}

#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[20] = "abcdef\0yyyyyyyyyyy";
  char arr2[] = "xxxxxxxxx";
  strncat(arr1, arr2, 3);
  return 0;
}

2.7 strncmp

int strncmp(const char* str1, const char* str2, size_t num);

  • 比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[] = "abcqwertyuiop";
  char arr2[] = "abcdef";
  printf("%d\n", strncmp(arr1, arr2, 3));//0
  return 0;
}

2.8 strstr

char* strstr(const char* str1, const char* str2);

  • Returns a pointer to the first occurrence of str2 in str1, or a null pointer if str2 is not part of str1.
//strstr - 字符串中找子字符串
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[] = "abcdefabcdef";
  char arr2[] = "def";
  char* ret = strstr(arr1, arr2);
  
  if (ret != NULL)
  {
    printf("%s\n", ret);//defabcdef
  }
  else
  {
    printf("找不到\n");
  }
  return 0;
}
#include <stdio.h>
#include <string.h>
int main()
{
  char arr1[] = "abcdefabcdef";
  char arr2[] = "deq";
  char* ret = strstr(arr1, arr2);
  if (ret != NULL)
  {
    printf("%s\n", ret);
  }
  else
  {
    printf("找不到\n");
  }
  //找不到对应的字符串,返回的是NULL,所以打印找不到
  return 0;
}

strstr函数的模拟实现:

#include <stdio.h>
char* my_strstr(const char* str1, const char* str2)
{
  char* cp = str1;
  char* s1 = cp;
  char* s2 = str2;
  while (*cp)
  {
    //开始匹配
    s1 = cp;
    s2 = str2;
    while (*s1 && *s2 && *s1 == *s2)
    {
      s1++;
      s2++;
    }
    if ('\0' == *s2)
    {
      return cp;
    }
    cp++;
  }
  return NULL;
}
int main()
{
  char arr1[] = "abbbcdef";
  char arr2[] = "bbc";
  char* ret = my_strstr(arr1, arr2);
  if (ret != NULL)
  {
    printf("%s\n", ret);//bbcdef
  }
  else
  {
    printf("找不到\n");
  }
  return 0;
}

2.9 strtok

char* strtok(char* str, const char* sep);

  • sep参数是个字符串,定义了用作分隔符的字符集合。
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用 ‘\0’ 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h>
#include <string.h>
int main()
{
  char arr[] = "zhangsan@yeah.net";
  char copy[20];
  strcpy(copy, arr);
  char sep[] = "@.";
  char* ret = strtok(copy, sep);
  printf("%s\n", ret);//zhangsan
  ret = strtok(NULL, sep);
  printf("%s\n", ret);//yeah
  
  ret = strtok(NULL, sep);
  printf("%s\n", ret);//net
  return 0;
}

但是如果我们不知道它被分成了几段,那么我们应该怎么把它们全部打印出来呢?

#include <stdio.h>
#include <string.h>
int main()
{
  char arr[] = "zhangsan@yeah.net@666#777";
  char copy[30];
  strcpy(copy, arr);
  char sep[] = "@.#";
  char* ret = NULL;
  for (ret = strtok(copy, sep); ret != NULL; ret = strtok(NULL, sep))
  {
    printf("%s\n", ret);
  }
  return 0;
}

2.10 strerror

char* strerror(int errnum);

  • 返回错误码所对应的错误信息。
  • 库函数在执行的时候,发生了错误,会将一个错误码存放在errno这个变量中,errno是C语言提供的一个全局变量
#include <stdio.h>
#include <string.h>
int main()
{
  int i = 0;
  
  for (i = 0; i < 10; i++)
  {
    printf("%d: %s\n", i, strerror(i));
  }
  return 0;
}

举个具体的例子:

#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
  //C语言中可以操作文件
  //操作文件的步骤
  //1. 打开文件
  //2. 读/写文件
  //3. 关闭文件
  FILE* pf = fopen("data.txt", "r");//打开data.txt这个文件,而且是为了读来打开这个文件,这个函数返回的是一个FILE*的指针,打开失败返回的是空指针
  if (NULL == pf)
  {
    printf("%s\n", strerror(errno));
    //如果当前路径底下没有data.txt这个文件,就会打印No such file or directory
    
    return 1;//和ruturn 0做个区分,这是失败返回的
  }
  //读文件
  //...
  //关闭文件
  fclose(pf);
  return 0;
}

还有一个函数可以直接就把错误信息打印出来:

#include <stdio.h>
int main()
{
  //C语言中可以操作文件
  //操作文件的步骤
  //1. 打开文件
  //2. 读/写文件
  //3. 关闭文件
  FILE* pf = fopen("data.txt", "r");
  if (NULL == pf)
  {
    perror("fopen");//如果当前路径底下没有data.txt这个文件,就会打印fopen: No such file or directory
    //先打印fopen: ,然后再打印错误信息
    //perror里面的内容可以自定义
    
    return 1;
  }
  //读文件
  //...
  //关闭文件
  fclose(pf);
  return 0;
}

2.11 字符分类函数

注:

ASCII码表中0~31是不可打印字符,其他是可打印字符。

#include <stdio.h>
#include <ctype.h>
int main()
{
  //isupper
  //大写返回非0
  //其他返回0
  printf("%d\n", isupper('A'));//1
  printf("%d\n", isupper('a'));//0
  printf("%d\n", isdigit('2'));//4
  printf("%d\n", isdigit('X'));//0
  return 0;
}

2.12 字符转换函数

int tolower(int c);

int toupper(int c);

#include <stdio.h>
#include <ctype.h>
int main()
{
  printf("%c\n", tolower('A'));//a
  printf("%c\n", tolower('s'));//s
  return 0;
}

最后,我们来看一道题目:

//将字符串中的内容全部改成小写
#include <stdio.h>
#include <ctype.h>
int main()
{
  char arr[20] = { 0 };
  gets(arr);//遇到空格继续读
  //比如输入:I am a Good Student
  char* p = arr;
  while (*p)
  {
    if (isupper(*p))
    {
      *p = tolower(*p);
    }
    p++;
  }
  printf("%s\n", arr);//i am a good student
  return 0;
}


目录
相关文章
|
1月前
|
C语言 C++
C语言 之 内存函数
C语言 之 内存函数
33 3
|
8天前
|
缓存 算法 Java
本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制
在现代软件开发中,性能优化至关重要。本文聚焦于Java内存管理与调优,介绍Java内存模型、内存泄漏检测与预防、高效字符串拼接、数据结构优化及垃圾回收机制。通过调整垃圾回收器参数、优化堆大小与布局、使用对象池和缓存技术,开发者可显著提升应用性能和稳定性。
27 6
|
26天前
|
程序员 C++ 容器
在 C++中,realloc 函数返回 NULL 时,需要手动释放原来的内存吗?
在 C++ 中,当 realloc 函数返回 NULL 时,表示内存重新分配失败,但原内存块仍然有效,因此需要手动释放原来的内存,以避免内存泄漏。
|
1月前
|
存储 程序员 编译器
C语言——动态内存管理与内存操作函数
C语言——动态内存管理与内存操作函数
|
1月前
|
编译器 C语言 C++
详解C/C++动态内存函数(malloc、free、calloc、realloc)
详解C/C++动态内存函数(malloc、free、calloc、realloc)
154 1
|
1月前
|
程序员 C语言
C语言内存函数精讲
C语言内存函数精讲
|
22天前
|
存储 C语言
【c语言】字符串函数和内存函数
本文介绍了C语言中常用的字符串函数和内存函数,包括`strlen`、`strcpy`、`strcat`、`strcmp`、`strstr`、`strncpy`、`strncat`、`strncmp`、`strtok`、`memcpy`、`memmove`和`memset`等函数的使用方法及模拟实现。文章详细讲解了每个函数的功能、参数、返回值,并提供了具体的代码示例,帮助读者更好地理解和掌握这些函数的应用。
19 0
|
1月前
|
C语言 C++
c语言回顾-内存操作函数
c语言回顾-内存操作函数
39 0
|
1月前
|
存储 C语言 C++
来不及哀悼了,接下来上场的是C语言内存函数memcpy,memmove,memset,memcmp
本文详细介绍了C语言中的四个内存操作函数:memcpy用于无重叠复制,memmove处理重叠内存,memset用于填充特定值,memcmp用于内存区域比较。通过实例展示了它们的用法和注意事项。
64 0
|
1月前
一刻也没有为它哀悼~接下来登场的是动态内存分配的malloc与realloc以及free函数
一刻也没有为它哀悼~接下来登场的是动态内存分配的malloc与realloc以及free函数
65 0