【字符串】【分类讨论】【KMP】1163. 按字典序排在最后的子串

简介: 【字符串】【分类讨论】【KMP】1163. 按字典序排在最后的子串

本文涉及知识点

字符串 字典序 分类讨论

本题无法使用KMP,因为t1不段变化。

LeetCode1163. 按字典序排在最后的子串

给你一个字符串 s ,找出它的所有子串并按字典序排列,返回排在最后的那个子串。

示例 1:

输入:s = “abab”

输出:“bab”

解释:我们可以找出 7 个子串 [“a”, “ab”, “aba”, “abab”, “b”, “ba”, “bab”]。按字典序排在最后的子串是 “bab”。

示例 2:

输入:s = “leetcode”

输出:“tcode”

提示:

1 <= s.length <= 4 * 105

s 仅含有小写英文字符。

KMP

令s[0,i)的最后子串是t1,s[0,i]的最后子串t2。则t2一定以s[i],结尾,因为t1+s[i]一定在t1后面。

{ 从 t 1 取 0 个字符, t 2 = s [ i ] s [ i ] > t [ 0 ] 从 t 1 取后 m 个字符 t [ i − m , i ) + s [ i ] 条件下面详述

image.png

t1[0,m) 不会小于 t[i-m,i),否则t1就是t[n-m,m)。

如果两种是大于关系,则t1[0,m]大于 t[i-m,i)+s[i] ,不成立。

故一定是相等关系,且t1[m]小于s[i]。

可以利用KMP的公共前后缀。

如果以上情况都不符合,则t2 = t1 + s[i]。

如果使用KMP,t1不断变化,时间复杂度是O(nn),超时。

分类讨论

令n = s.length()。

性质一:令s[x,y)是最后的子串,x∈ \in[0,n)则y=n。因为s[x,n)的字典序比s[x,y)大。

性质二:令s[i,n)在s[x,n)中的字典序最大,x∈ \in[0,j)。确保:j > i。

令s[i,i+k)和s[j,j+k)相等,下标 j+K非法, s[i+k]!=s[j+k]。初始:i=0,j=1,k=0

image.png

待证明一

显然s[j,n)的字典序大于s[i,n)结合性质二,s[j,n)是 s[x,n)中的最大字典序,x∈ \in[0,j+1)。

待证明二

令x ∈ \in[j,j+k] ,则len = x - j+1 。

s[x,n)的字典序小于s[i+len,n),结合性质二,s[i+len,n)小于s[i],s[x,n)小于s[i,n)。现在来证明无后效性:

从小到处理len,则:

s[0,j+len)符合性质二,由于s[0,i+len]符合性质二。

超时

多余n-1个a,后面跟一个b。时间复杂度O(nn)。

代码

核心代码

class Solution {
public:
  string lastSubstring(string s) {
    int i = 0;
    for (int j = 1; j < s.length(); )
    {
      int k = 0;
      for (; ((j + k) < s.length()) && (s[j + k] == s[i + k]); k++);
      int tmp = i;
      if (s[i + k] < s[j + k])
      {
        i = j++;
      }
      else
      {
        j += k + 1;
      }     
    }
    return s.substr(i);
  }
};

测试用例

template<class T,class T2>
void Assert(const T& t1, const T2& t2)
{
  assert(t1 == t2);
}
template<class T>
void Assert(const vector<T>& v1, const vector<T>& v2)
{
  if (v1.size() != v2.size())
  {
    assert(false);
    return;
  }
  for (int i = 0; i < v1.size(); i++)
  {
    Assert(v1[i], v2[i]);
  }
}
int main()
{
  string s ;
  {
    Solution sln;
    s = "cacacb";
    auto res = sln.lastSubstring(s);
    Assert("cb", res);
  }
  {
    Solution sln;
    s = "abab";
    auto res = sln.lastSubstring(s);
    Assert("bab", res);
  }
  {
    Solution sln;
    s = "leetcode";
    auto res = sln.lastSubstring(s);
    Assert("tcode", res);
  }
  
}

优化

极端情况下,i=j++,执行了n次,k也为n。故时间复杂度为O(nn)。

分两种情况:

一,i+k <= j 不变。

二,i+k > j。下面具体分析:

令m = j-i。

将s[j,j+k)和s[i,i+k)分成若干块,最后一块长度为k%m,前面的块长度都为m,则:

s[j,j+k)的各块分别为:s[j,i) s[i,i+m) s[i+m,i+m2) ⋯ \cdots
s[i,i+k)的个块分别为:s[i,i+m) s[i+m,i+m
2) ⋯ \cdots

→ \rightarrow s[j,i) == s [i,i+m) == s[i+m,i+m*2) ⋯ \cdots

显然s[j,n)淘汰了s[i,n)

x$\in[0,m)

s[j,n)能够淘汰s[j+n,n) 因为s[i,n)删除前m个字符,s[i+x,n)删除就是两者。

同理:s[j+m,n)能淘汰s[j]和s[j+m+x,n)。

⋮ \vdots

故 i =j + k - (k%m)    ⟺    \iff i+m+k - (k%m)

因为 m > k%m ,所以 i+m+k - (k%m) > i+ k,也就i至少增加k。

无论什么情况:

i或j至少有一个至少增加k,故总时间复杂度是O(n)。

代码

class Solution {
public:
  string lastSubstring(string s) {
    int i = 0;
    for (int j = 1; j < s.length(); )
    {
      int k = 0;
      for (; ((j + k) < s.length()) && (s[j + k] == s[i + k]); k++);
      int tmp = i;
      if (s[i + k] < s[j + k])
      {
        const int m = j - i;
        if (k > m)
        {
          i = (j + k - k%m);
          j = i + 1;
        }
        else
        {
          i = j++;
        }
      }
      else
      {
        j += k + 1;
      }     
    }
    return s.substr(i);
  }
};

2023年5月版

class Solution {
public:
string lastSubstring(string s) {
int iMaxIndex = 0;
for (int i = 1; i < s.length(); i++)
{
int k = 0;
for (; (i + k < s.length()) && (s[i + k] == s[iMaxIndex + k]); k++)
{
}
if ((i + k < s.length()) && (s[i + k] > s[iMaxIndex + k]))
{
auto tmp = iMaxIndex;
iMaxIndex = i;
i = max(i,tmp+k);
}
else
{
i = i + k ;
}
}
return s.substr(iMaxIndex);
}
};

2024年2月版

class Solution {
public:
string lastSubstring(string s) {
int i = 0;
for (int j = 1; j < s.length(); )
{
int k = 0;
for (; ((j + k) < s.length()) && (s[j + k] == s[i + k]); k++);
int tmp = i;
if (s[i + k] < s[j + k])
{
const int m = j - i;
if (k > m)
{
i += k+1;
j = i + 1;
}
else
{
i = j++;
}
}
else
{
j += k + 1;
}
}
return s.substr(i);
}
};


扩展阅读

视频课程

有效学习:明确的目标 及时的反馈 拉伸区(难度合适),可以先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。

https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程

https://edu.csdn.net/lecturer/6176

相关

下载

想高屋建瓴的学习算法,请下载《喜缺全书算法册》doc版

https://download.csdn.net/download/he_zhidan/88348653

我想对大家说的话
闻缺陷则喜是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法用**C++**实现。

相关文章
|
网络协议 前端开发 安全
Netty
Netty
840 1
|
8月前
|
JSON API 数据安全/隐私保护
1688 商品详情API接口(1688API 系列)
1688 商品详情 API 接口是电商应用开发中的关键工具,尤其适用于整合 1688 平台的商品数据。该接口提供商品的基础属性、价格、库存、图片、描述及商家信息等多维度数据,支持 HTTP GET 和 POST 请求方式。通过必填的商品 ID 及可选的语言参数等,开发者能精准获取并展示商品详情,提升用户体验和决策效率。响应数据包括商品名称、类目、品牌、价格区间、库存、图片列表、详细描述及商家信息等,帮助技术员高效集成接口,实现与 1688 平台的无缝对接。供稿者:Taobaoapi2014。
|
人工智能 图形学
【制作100个unity游戏之24】unity制作一个3D动物AI生态系统游戏1(附项目源码)
【制作100个unity游戏之24】unity制作一个3D动物AI生态系统游戏1(附项目源码)
373 3
|
人工智能
西门子S7-300的硬件结构,各模块按照什么顺序来组态?
今天我们来介绍一下西门子S7-300的硬件结构,并和大家讲一下S7-300各模块是按照什么顺序来组态的。
西门子S7-300的硬件结构,各模块按照什么顺序来组态?
|
移动开发 小程序 前端开发
php + h5使用 scheme页面跳转微信小程序-其他浏览器一键跳转到微信并打开小程序
php + h5使用 scheme页面跳转微信小程序-其他浏览器一键跳转到微信并打开小程序
428 0
|
关系型数据库 MySQL API
用Python一键艺龙酒店各个城市数据存入mysql
用Python一键艺龙酒店各个城市数据存入mysql
187 0
|
网络协议 Shell 网络安全
iOS 逆向编程(九 - 1)通过 USB 连接登录 iPhone 以及端口映射
iOS 逆向编程(九 - 1)通过 USB 连接登录 iPhone 以及端口映射
559 0
|
XML 数据可视化 Java
SpringBoot 集成 Flowable + Flowable Modeler 流程配置可视化(图解)(二)
SpringBoot 集成 Flowable + Flowable Modeler 流程配置可视化(图解)
1005 0
|
前端开发 JavaScript 安全
微前端之IceStark介绍和基础使用
微前端之IceStark介绍和基础使用
1366 1
|
弹性计算 固态存储 数据可视化
阿里云轻量应用服务器2核2G3M带宽优惠价108元CPU性能测评
阿里云轻量应用服务器2核2G3M带宽优惠价108元CPU性能测评
462 0