探索字符与字符串:基本库函数的使用(二)

简介: 探索字符与字符串:基本库函数的使用(二)

前言

继接上文,本片文章我将带领大家去模拟实现一些基本的库函数。


函数模拟实现

strlen

前文我们已将基本了解了strlen函数是用于计算字符串长度的,那么接下来我们来模拟实现一下该函数

strlen函数统计的是\0之前的字符个数,函数返回类型是int,这里我们有三种实现方法:

方法一:计数器

int my_strlen(const char *ch)
{
  int i = 0;
  while(*ch != '\0') {
    ch++;
    i++;
  }
  return i;
}

方法二:递归

int my_strlen(const char * str)
{
if(*str == '\0')
return 0;
else
return 1+my_strlen(str+1);
}

方法三:指针运算

int my_strlen(char *s)
{
char *p = s;
while(*p != ‘\0’ )
p++;
return p-s;
}

这些方法的代码实现都较为简单,就不再细介绍。

strcpy

在模拟实现strcpy函数时需要注意以下几点:

  • 函数参数顺序
  • 函数的功能,停止条件
  • assert
  • const修饰指针
  • 函数返回值

我们再来看一下函数的原型:

char* strcpy(char * destination, const char * source );

注意const修饰的参数模拟实现代码:

char *my_strcpy(char* dest, const char* src)
{
  assert(src&&dest);
  char* ret = dest;
  while (*dest++ = *src++)
  {
    ;
  }
  return ret;
}

assert断言,为了防止传进来为NULL,后置++的优先级高于*,所以在*dest++中先后置++,再解引用。当赋值到\0时循环就会结束,返回目标字符串的起始位置。

strcat

函数的原型与strcpy函数原型类似。

strcat函数的功能是连接两个字符串,我们可以依据strcpy的思路将源字符串的内容copy到目标字符串的末尾,我们只需找到目标字符串中\0的位置即可

代码实现:

char *my_strcat(char *dest, const char*src)
{
char *ret = dest;
assert(dest != NULL);
assert(src != NULL);
while(*dest)
{
dest++;
}
while((*dest++ = *src++))
{
;
}
return ret;
}

那为什么strcat最好不要自己给自己追加。

看到模拟实现的strcat我们或许就会发现问题:

如果自己给自己追加,初始时dest和src就指向同一个字符串,当dest 向后移动找到\0以后就会停止(需要追加的位置),然后就会开始追加,将src指向的字符赋给dest指向的位置,这就会把\0给替换掉:

但是\0对于src来说又很重要,这是循环结束的标志,而此时\0被替换,循环就无法停止,便会一直向后赋值,知道越界访问程序崩溃停止。

strstr

strstr函数的功能是在一个字符串中查找指定的子串,并返回该子串在原字符串中的起始位置。

函数原型:

char* strstr(const char* str1, const char* str2);

strstr在不依靠库函数的情况下,对其模拟实现可能有点复杂。

具体代码:

char* my_strstr(char* str1, char* str2)
{
  char* s1 = str1;
  char* s2 = str2;
  char* cp = str1;
  while (*cp)
  {
    s1 = cp;
    s2 = str2;
    while (*s1 && * s2 && *s1 == *s2)
    {
      s1++;
      s2++;
    }
    if (*s2 == '\0')
      return cp;
    cp++;
  }
  return NULL;
}

以a b b b c d e f和b b c为例:

初始时两指针指向两字符串的首元素地址,问题在于要确定开始匹配的位置,那么我们就需要一个指针来存放开始匹配的位置,我们设为cp,初始阶段开始匹配,cp指向的位置和str1相同。

cp不断的向后寻找开始匹配的位置,如果*cp=\0,就说明cp遍历了整个字符串都没有找到匹配点,说明str2不属于str1的子字符串,返回NULL。

以此为前提才能开始匹配。从第一个字符开始向后匹配,匹配失败后我们就需要移动cp向后移动尝试从下一个位置开始,所以进行cp++;

s1和s2是进行字符比对的指针,起初s1和s2都是从字符串的首元素开始:

然后s1和s2同步进行移动,对字符进行一一比对,

while (*s1 == *s2)
    {
      s1++;
      s2++;
    }

如果匹配失败,cp就向后移动,s1从cp指向的位置开始继续比对(s1=cp),s2从str2指向的字符串的首元素开始(s2=str2),如果匹配成功,此时的s2指向的一定是字符串末尾的\0由此我们就可以以此为判定条件,判断是否匹配成功:

while (*s1 && * s2 && *s1 == *s2)
    {
      s1++;
      s2++;
    }
    if (*s2 == '\0')
      return cp;

匹配成功就可以提前结束程序,返回首次匹配成功的初始位置(return cp)。遍历结束都没有找到则返回空指针。

strcmp

strcmp函数的功能是比较两字符串大小。

具体功能:

  • 比较两个字符串的大小。
  • 返回一个整数值,表示两个字符串的大小关系。
  • 如果字符串相等,返回值为0。
  • 如果字符串1大于字符串2,返回值大于0。
  • 如果字符串1小于字符串2,返回值小于0

由此我们来模拟实现一下,首先我们依次比对两个字符串对应位置字符的大小。如果有一个遍历结束,就返回0。但切记while循环里不可以这样写*str1++ == *str2++。

如果str1和str2不相等退出循环后仍会向后走一步,这样就跳过了对应位置上第一个不相等的字符,就会导致在判断大小时出现错误。

所以我们选择在循环里进行++操作。

在两字符不相等的前提下,如果str1指向的字符大于str2指向的字符,就返回1,否则就返回-1

int  my_strcmp(const char* str1,const char* str2)
{
  assert(str1 && str2);
  while (*str1 == *str2)
  {
    if (*str1 == '\0')
      return 0;
    str1++;
    str2++;
  }
  if (*str1 > *str2)
    return 1;
  else
    return -1;

memcpy

函数原型:

void * memcpy ( void * destination, const void * source, size_t num );

从source的位置开始向后复制num个字节的数据到destination的内存位置。

此外我们还要注意:

  • 这个函数在遇到 '\0' 的时候并不会停下来。
  • 如果source和destination有任何的重叠,复制的结果都是未定义的。

这里注意,memcpy的函数类型是void* 类型,这表明memcpy函数可以用于所以类型的数据。

那么在模拟实现时,我们就要设计一个可以适用于任何类型的函数。最终的返回结果是目标dest数据的起始地址。

于是我们就可以这样设计

模拟代码演示:

void* my_memcpy(void* dest, void* src, size_t num)
{
  void* ret = dest;
  assert(dest && src);
  while (num--)
  {
    *(char*)dest = *(char*)src;
    dest = (char*)dest + 1;
    src = (char*)src + 1;
  }
  return ret;
}

num为需要copy的字节大小,可以作为循环的次数,不管传入任何类型的数据,我们都将其转换为char*类型,进行一个字节一个字节的复制。最终返回目标dest数据的起始地址。只需创建一个变量存储即可。

memmove

函数原型:

void* memmove(void* dest, const void* src, size_t n);

dest是目标内存的起始地址,src是源内存的起始地址,n是要移动的字节数

注意:函数原型中的参数类型都是void*,表示传入的参数是任意类型的指针,可以用于处理不同类型的数据。返回值类型是void*,表示返回一个指向目标内存的指针。

那么我们要如何设计呢?

有人可能会想,这个简单,我们模仿上边的memcpy函数进行复制就好了,但这样真的可以吗?

在模拟的memcpy中确实可以实现部分的数据移动,但它并不完善。这里我们需要考虑到数据覆盖问题。

如果是将数据从高地址移动到同一数组的低地址处,这样可以实现如:

memcpy(arr, arr + 2, 20);

但如果是将前边的数据向后移动呢?

memcpy(arr+2, arr , 20);

当我们想把arr处20个字节的数据向后移动2个单位时,1赋值给了3,2赋值给了4,那到3赋值时3的值就已经被覆盖,这就会导致最终结果错误。

那我们应该怎么解决呢?

这时我们就可以考虑从源数据段的最后边开始赋值,20个字节,5个元素,先将5赋给7,4赋给6,3赋给5……

 

这样就可以实现向后移动。

回到memmove函数,它是一个可以接收任何类型数据的函数,那么次时我们就需要将数据类型转换为char*类型,进行一个字节一个字节的赋值。

代码实现:

my_memmove(void* dest, const void* src, size_t n)
{
  if (dest < src)
  {
    while (n--)
    {
      *(char*)dest = *(char*)src;
      dest = (char*)dest + 1;
      src = (char*)src + 1;
    }
  }
  else
  {
    while (n--)
    {
      *((char*)dest+n) = *((char*)src+n);
    }
  }
}

根据src和dest的大小进行判断,选择合适的方法。

(char*)dest+n和(char*)src+n将两个指针移动到需要后移的数据最后,从后向前依次赋值。每移动一个字节,n--,dest和src从最后向前一个字节,继续赋值……,直到需要移动的字节移动完毕停止。


总结

好的本期内容到此结束,模拟实现这些内容虽然很不常用,但是却可以帮助我们更好的理解和正确的使用这些库函数,同样也可以帮助我们提升一定的算法能力,对于处理一些字符操作题目很有帮助。最后,感谢阅读!

相关文章
|
8月前
|
存储 程序员 C语言
C语言:字符输出
C语言:字符输出
|
存储 安全 编译器
C语言字符及字符串讲解
C语言字符及字符串讲解
292 0
|
C语言
【嵌入式C语言】字符转字符串,整形数字转字符串技巧(sprintf函数妙用)
【嵌入式C语言】字符转字符串,整形数字转字符串技巧(sprintf函数妙用)
281 0
|
3月前
|
C语言
C语言字符(串)函数
C语言字符(串)函数
|
8月前
|
C语言
【C语言】字符分类函数与字符转换函数
【C语言】字符分类函数与字符转换函数
72 1
|
C语言 C++
C语言/关于字符和字符串的库函数
C语言/关于字符和字符串的库函数
|
8月前
|
安全 Unix Linux
【C/C++ 字符串】探索C语言之字符串分割函数:strtok和strsep的区别
【C/C++ 字符串】探索C语言之字符串分割函数:strtok和strsep的区别
181 0
|
8月前
|
存储 C语言
C语言字符输出函数
C语言字符输出函数
105 0
|
算法 编译器 C语言
有关字符串的那些库函数
有关字符串的那些库函数
|
存储 Serverless C语言
认识C语言 Day_3 >字符、字符串
认识C语言 Day_3 >字符、字符串