【数据结构】串的定义以及算法

简介: 【数据结构】串的定义以及算法


一、定义

串结构的定长顺序存储类似于线性表的顺序存储结构,用一组地址连续的存储单元存储串值的字符序列。

二、结构

在串的定长顺序存储结构中,按照预定义的大小,为每个定义的串变量分配一个固定长度的存储区,

  则可用定长数组如下描述之。
     typedef unsigned char SString[MAXLEN+1];

注意:

用SString[0]来存放串长信息;

串值后面加一个不计入串长度的标识符‘\0’;

串的实际长度可在予定义长度的范围内随意,超过予定义长度的串值则被舍去,称为“截断”

术语:

串的长度:串中字符的个数;零个字符的串称为空串,记为

空格串:由一个或多个空格组成的串,其长度为串中空格字符的个数

子串:串s中任意个连续的字符组成的子序列称为该串的子串,包含子串的串s相应地称为主串。

子串位置:字符在序列中的序号称为该字符在串中的位置。子串在主串中 的位置以第一个字符在主串中的位置来表示。

串相等:两个串相等,当且仅当这两个串的值相等。即,只有当两个串的长度相等,并且各个对应位置的字符都相等时才相等。


串的类型定义


    ADT string {
          数据对象:
          数据关系:
          数据操作:
            StrAssign(&T,chars);   //串赋值,生成一个值等于chars的串T
          StrCompare(S,T);   //串比较,若S>T,返回值>0……
            StrLength(S);   //求串长
            Concat(&T,S1,S2);   //串连接,用T返回S1+S2的新串
            SubString(&Sub,S,p,len);  //求S中p位置起长度为len的子串
            ……
            Index(S,T,p);  //返回子串T在主串S中p字符之后首次出现的位置
            Replace(&S,T,V);  //用子串V代替串S中所有的子串T
    }string


串的基本操作


/—初始化—/


/*---初始化---*/
void InitSString(SString s)
{
    s[0] = '\0';
}


/—串打印—/


/*---串打印---*/
void PrintString(SString s)
{
    printf("\n%s",s+1);
}


/—字符串的赋值—/


/*---字符串的赋值---*/
void StrAssign(SString s,char *str)
{
    int len = strlen(str);
    for(int i = 0;i<len;i++)
    {
        s[i+1] = str[i];
    }
    s[len+1] = '\0';
    s[0] = len;
}


/—求长度—/


/*---求长度---*/
int Strlenth(SString s)
{
    int len = 0;
    while(*s!='\0')
    {
        len++;
        s++;
    }
    return len;
}


/—创建串—/


/*---创建串---*/
bool CreatSString(SString s,char *str)
{
    InitSString(s);         //初始化
    StrAssign(s,str);       //串赋值
}


/—串连接—/


/*---串连接---*/
void Concat(SString t,SString s1,SString s2)
{
    int lens1= (int)s1[0];
    int lens2 = (int)s2[0];
    int i = 1,j = 1;
    while(i<=lens1)
    {
        t[i] = s1[i];
        i++;
    }
    t[0] = lens1;
    i--;                //根据结束条件 i=lens1+1,故t[i]此时没有赋值
    if((lens1+lens2)<MAXLEN)
    {
        while(j<=lens2)
        {
            t[i+j] = s2[j];
            j++;
        }
        t[0] = lens1+lens2;
    }
    else
    {
        while(j<MAXLEN-lens1)
        {
            t[i+j] = s2[j];
            j++;
        }
        t[0] = MAXLEN;
    }
    t[i+j+1] = '\0';
}


/—求子串—/


/*---求子串---*/
bool SubString(SString sub,SString s,int p,int len)
{
    /*get substring  */
    int i;
    if(p<1||p>s[0]||len<0||len>s[0]-p+1)
        /*子串长度为零/当子串长度大于主串/子串长度小于零/子串长度大于主串截取位置到最后的长度,错误*/
    return false;
    else
    {
        for(i=1;i<=len;i++)
           sub[i]=s[i+p-1];  /*复制字符 */
        sub[i]='\0';
        sub[0]=len;          /*修改表长*/
     return true;
    }
}


/—字符串比较—/


/*---字符串比较---*/
int StrCompare(SString s,SString t)
{
    int result = 0;//当比较结构相同时,为零。
    /*从s[1] 和 t[1] 开始比较*/
    s++;
    t++;
    while(*s!='\0' || *t!='\0')
    {
        result = *s - *t;
        if(result!= 0)
            break;/*如果不相等,得出结果并退出*/
        /*相等,下一组比较*/
        s++;
        t++;
    }
    return result;
}


/—删除子串—/


/*---删除子串---*/
//删除字符串:删除字符串S从pos位置开始的len长度子串
void StrDelete(SString s,int pos,int len)
{
    int s_len = Strlenth(s);//获取字符串的长度
    for(int i = pos + len;i<=s_len;i++)
    {
        //将字符串中从pos+len位置开始的字符全部前移len个
        s[i-len] = s[i];
    }
    s[0] = s_len-len;
    s[s_len-len+1] = '\0';
}


/—字符串清除—/


/*---字符串清除---*/
void StrClear(SString s)
{
  s[0] = '\0';
}


/—模式匹配(kmp算法)—/


/*---模式匹配(kmp算法)---*/
int StrIndex_kmp(SString s, char *str)
{
    int i = 1;
    int j = 0;
    int next[MAXLEN];
    int sLen = strlen(s);
    int pLen = strlen(str);
    GetNext(str,next);
    while (i < sLen && j < pLen)
    {
        //①如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++
        if (j == -1 || s[i] == str[j])
        {
            i++;
            j++;
        }
        else
        {
            //②如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]
            //next[j]即为j所对应的next值
            j = next[j];
        }
    }
    if (j == pLen)
        return i-pLen;
    else
        return -1;
}
/*---获得next数组---*/
 void GetNext(char *t,int next[])
{
   int j=0,k=-1;
        next[0]=-1;
    int len = strlen(t);
   while(j<len)
   {
      if(k == -1 || t[j] == t[k])
      {
         j++;k++;
         if(t[j]==t[k])//当两个字符相同时,就跳过
            next[j] = next[k];
         else
            next[j] = k;
      }
      else k = next[k];
   }
}


串的其他存储结构


1.顺序动态存储


typedef struct {
    char ch[maxsize];
     int length;
    } String, *string;


2.链式存储


  trpedef struct chunk{
  char ch[maxlen];
  struct chunk *next
  }chunk;
  typedef struct {
  chunk *head,*tail;
  int len;
  }lstring;


当maxlen= 1时,每个节点存放一个字符,便于进行插入和删除操作,但存储空间利用率太低;当maxlen>1时,每个节点存放多个字符,当最后一个字符未满是,不足处用特定字符(如“#”)补齐。此时提高了存储密度,但插入、删除的处理方法比较复杂,需要考虑节点的分拆和合并。


相关文章
|
2月前
|
人工智能 算法 搜索推荐
电商API的“AI革命”:全球万亿市场如何被算法重新定义?
AI+电商API正引领智能商业变革,通过智能推荐、动态定价与自动化运营三大核心场景,大幅提升转化率、利润率与用户体验。2025年,75%电商API将具备个性化能力,90%业务实现智能决策,AI与API的深度融合将成为未来电商竞争的关键基石。
|
2月前
|
存储 监控 安全
企业上网监控系统中红黑树数据结构的 Python 算法实现与应用研究
企业上网监控系统需高效处理海量数据,传统数据结构存在性能瓶颈。红黑树通过自平衡机制,确保查找、插入、删除操作的时间复杂度稳定在 O(log n),适用于网络记录存储、设备信息维护及安全事件排序等场景。本文分析红黑树的理论基础、应用场景及 Python 实现,并探讨其在企业监控系统中的实践价值,提升系统性能与稳定性。
65 1
|
2月前
|
存储 监控 算法
基于跳表数据结构的企业局域网监控异常连接实时检测 C++ 算法研究
跳表(Skip List)是一种基于概率的数据结构,适用于企业局域网监控中海量连接记录的高效处理。其通过多层索引机制实现快速查找、插入和删除操作,时间复杂度为 $O(\log n)$,优于链表和平衡树。跳表在异常连接识别、黑名单管理和历史记录溯源等场景中表现出色,具备实现简单、支持范围查询等优势,是企业网络监控中动态数据管理的理想选择。
71 0
|
6月前
|
存储 算法 Java
算法系列之数据结构-二叉树
树是一种重要的非线性数据结构,广泛应用于各种算法和应用中。本文介绍了树的基本概念、常见类型(如二叉树、满二叉树、完全二叉树、平衡二叉树、B树等)及其在Java中的实现。通过递归方法实现了二叉树的前序、中序、后序和层次遍历,并展示了具体的代码示例和运行结果。掌握树结构有助于提高编程能力,优化算法设计。
182 10
 算法系列之数据结构-二叉树
|
6月前
|
算法 Java
算法系列之数据结构-Huffman树
Huffman树(哈夫曼树)又称最优二叉树,是一种带权路径长度最短的二叉树,常用于信息传输、数据压缩等方面。它的构造基于字符出现的频率,通过将频率较低的字符组合在一起,最终形成一棵树。在Huffman树中,每个叶节点代表一个字符,而每个字符的编码则是从根节点到叶节点的路径所对应的二进制序列。
153 3
 算法系列之数据结构-Huffman树
|
6月前
|
算法 Java
算法系列之数据结构-二叉搜索树
二叉查找树(Binary Search Tree,简称BST)是一种常用的数据结构,它能够高效地进行查找、插入和删除操作。二叉查找树的特点是,对于树中的每个节点,其左子树中的所有节点都小于该节点,而右子树中的所有节点都大于该节点。
184 22
|
7月前
|
存储 机器学习/深度学习 算法
C 408—《数据结构》算法题基础篇—链表(下)
408考研——《数据结构》算法题基础篇之链表(下)。
193 30
|
7月前
|
存储 算法 C语言
C 408—《数据结构》算法题基础篇—链表(上)
408考研——《数据结构》算法题基础篇之链表(上)。
296 25
|
10月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
217 59
|
3月前
|
编译器 C语言 C++
栈区的非法访问导致的死循环(x64)
这段内容主要分析了一段C语言代码在VS2022中形成死循环的原因,涉及栈区内存布局和数组越界问题。代码中`arr[15]`越界访问,修改了变量`i`的值,导致`for`循环条件始终为真,形成死循环。原因是VS2022栈区从低地址到高地址分配内存,`arr`数组与`i`相邻,`arr[15]`恰好覆盖`i`的地址。而在VS2019中,栈区先分配高地址再分配低地址,因此相同代码表现不同。这说明编译器对栈区内存分配顺序的实现差异会导致程序行为不一致,需避免数组越界以确保代码健壮性。
47 0
栈区的非法访问导致的死循环(x64)

热门文章

最新文章