【KMP】【二分查找】【C++算法】100207. 找出数组中的美丽下标 II

简介: 【KMP】【二分查找】【C++算法】100207. 找出数组中的美丽下标 II

LeetCode100207. 找出数组中的美丽下标 II

给你一个下标从 0 开始的字符串 s 、字符串 a 、字符串 b 和一个整数 k 。

如果下标 i 满足以下条件,则认为它是一个 美丽下标 :

0 <= i <= s.length - a.length

s[i…(i + a.length - 1)] == a

存在下标 j 使得:

0 <= j <= s.length - b.length

s[j…(j + b.length - 1)] == b

|j - i| <= k

以数组形式按 从小到大排序 返回美丽下标。

示例 1:

输入:s = “isawsquirrelnearmysquirrelhouseohmy”, a = “my”, b = “squirrel”, k = 15

输出:[16,33]

解释:存在 2 个美丽下标:[16,33]。

  • 下标 16 是美丽下标,因为 s[16…17] == “my” ,且存在下标 4 ,满足 s[4…11] == “squirrel” 且 |16 - 4| <= 15 。
  • 下标 33 是美丽下标,因为 s[33…34] == “my” ,且存在下标 18 ,满足 s[18…25] == “squirrel” 且 |33 - 18| <= 15 。
    因此返回 [16,33] 作为结果。
    示例 2:
    输入:s = “abcd”, a = “a”, b = “a”, k = 4
    输出:[0]
    解释:存在 1 个美丽下标:[0]。
  • 下标 0 是美丽下标,因为 s[0…0] == “a” ,且存在下标 0 ,满足 s[0…0] == “a” 且 |0 - 0| <= 4 。
    因此返回 [0] 作为结果。
    提示:
    1 <= k <= s.length <= 5 * 105
    1 <= a.length, b.length <= 5 * 105
    s、a、和 b 只包含小写英文字母。

KMP

KMP类的 vector m_vSameLen;//m_vSame[i]记录 s[i…]和t[0…]最长公共前缀,增加可调试性

枚举(s,a)的下标看m_vSameLen[i] 是否等于a.length。

(s,b)类似。将符合条件的下标放到bindex中,由于是升序,所以可以用二分查找。看是否存在[i-k,i+k]的下标。

代码

封装类

class KMP
{
public:
  virtual int Find(const string& s, const string& t)
  {
    CalLen(t);
    m_vSameLen.assign(s.length(), 0);
    for (int i1 = 0, j = 0; i1 < s.length(); )
    {
      for (; (j < t.length()) && (i1 + j < s.length()) && (s[i1 + j] == t[j]); j++);
      //i2 = i1 + j 此时s[i1,i2)和t[0,j)相等 s[i2]和t[j]不存在或相等
      m_vSameLen[i1] = j;
      //t[0,j)的结尾索引是j-1,所以最长公共前缀为m_vLen[j-1],简写为y 则t[0,y)等于t[j-y,j)等于s[i2-y,i2)
      if (0 == j)
      {
        i1++;
        continue;
      }
      const int i2 = i1 + j;
      j = m_vLen[j - 1];
      i1 = i2 - j;//i2不变
    }
    for (int i = 0; i < m_vSameLen.size(); i++)
    {//多余代码是为了增加可测试性
      if (t.length() == m_vSameLen[i])
      {
        return i;
      }
    }
    return -1;
  }
  vector<int> m_vSameLen;//m_vSame[i]记录 s[i...]和t[0...]最长公共前缀,增加可调试性
protected:
  void CalLen(const string& str)
  {
    m_vLen.resize(str.length());
    for (int i = 1; i < str.length(); i++)
    {
      int next = m_vLen[i - 1];
      while (str[next] != str[i])
      {
        if (0 == next)
        {
          break;
        }
        next = m_vLen[0];
      }
      m_vLen[i] = next + (str[next] == str[i]);
    }
  }
  int m_c;
  vector<int> m_vLen;//m_vLen[i] 表示t[0,i]的最长公共前后缀 
};

核心代码

class Solution {
public:
  vector<int> beautifulIndices(string s, string a, string b, int k) {
    KMP kmpa, kmpb;
    kmpa.Find(s, a);
    kmpb.Find(s, b);
    vector<int> bindex;
    for (int i = 0; i < kmpb.m_vSameLen.size(); i++)
    {
      if (kmpb.m_vSameLen[i] == b.length())
      {
        bindex.emplace_back(i);
      }
    }
    vector<int> vRet;
    for (int i = 0; i < kmpa.m_vSameLen.size(); i++)
    {
      if (kmpa.m_vSameLen[i] == a.length())
      {
        auto it1 = std::lower_bound(bindex.begin(), bindex.end(), i - k);
        auto it2 = std::upper_bound(bindex.begin(), bindex.end(), i + k);
        if (it2 - it1 > 0)
        {
          vRet.emplace_back(i);
        }
      }
    }
    return vRet;
  }
};

测试用例

template<class T>
void Assert(const T& t1, const T& t2)
{
  assert(t1 == t2);
}
template<class T>
void Assert(const vector<T>& v1, const vector<T>& v2)
{
  if (v1.size() != v2.size())
  {
    assert(false);
    return;
  }
  for (int i = 0; i < v1.size(); i++)
  {
    Assert(v1[i], v2[i]);
  }
}
int main()
{
  string a,b,s;
  int k;
  {
    Solution sln;
    s = "isawsquirrelnearmysquirrelhouseohmy", a = "my", b = "squirrel", k = 15;
    auto res = sln.beautifulIndices(s, a, b, k);
    Assert(vector<int>{16, 33}, res);
  }
  {
    Solution sln;
    s = "abcd", a = "a", b = "a", k = 4;
    auto res = sln.beautifulIndices(s, a, b, k);
    Assert(vector<int>{0}, res);
  }
}


扩展阅读

视频课程

有效学习:明确的目标 及时的反馈 拉伸区(难度合适),可以先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。

https://edu.csdn.net/course/detail/38771

如何你想快

速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程

https://edu.csdn.net/lecturer/6176

相关下载

想高屋建瓴的学习算法,请下载《喜缺全书算法册》doc版

https://download.csdn.net/download/he_zhidan/88348653

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法用**C++**实现。

相关文章
|
2天前
|
存储 C++
【C++模板】模板实现通用的数组
【C++模板】模板实现通用的数组
|
6天前
|
存储 缓存 算法
C++从入门到精通:4.6性能优化——深入理解算法与内存优化
C++从入门到精通:4.6性能优化——深入理解算法与内存优化
|
6天前
|
存储 算法 程序员
C++从入门到精通:2.2.1标准库与STL容器算法深度解析
C++从入门到精通:2.2.1标准库与STL容器算法深度解析
|
7天前
|
存储 人工智能 C++
【重学C++】【指针】详解让人迷茫的指针数组和数组指针
【重学C++】【指针】详解让人迷茫的指针数组和数组指针
27 1
|
18天前
|
算法
算法系列--两个数组的dp问题(2)(下)
算法系列--两个数组的dp问题(2)(下)
20 0
|
18天前
|
存储 算法
算法系列--动态规划--⼦数组、⼦串系列(数组中连续的⼀段)(1)(下)
算法系列--动态规划--⼦数组、⼦串系列(数组中连续的⼀段)(1)
18 0
|
18天前
|
算法
算法系列--动态规划--⼦数组、⼦串系列(数组中连续的⼀段)(1)(上)
算法系列--动态规划--⼦数组、⼦串系列(数组中连续的⼀段)(1)
22 0
|
10天前
|
机器学习/深度学习 人工智能 算法
基于DCT和扩频的音频水印嵌入提取算法matlab仿真
本文介绍了结合DCT和扩频技术的音频水印算法,用于在不降低音质的情况下嵌入版权信息。在matlab2022a中实现,算法利用DCT进行频域处理,通过扩频增强水印的隐蔽性和抗攻击性。核心程序展示了水印的嵌入与提取过程,包括DCT变换、水印扩频及反变换步骤。该方法有效且专业,未来研究将侧重于提高实用性和安全性。
|
25天前
|
机器学习/深度学习 算法
【MATLAB】GA_BP神经网络时序预测算法
【MATLAB】GA_BP神经网络时序预测算法
35 8
|
1天前
|
算法 TensorFlow 算法框架/工具
基于直方图的图像阈值计算和分割算法FPGA实现,包含tb测试文件和MATLAB辅助验证
这是一个关于图像处理的算法实现摘要,主要包括四部分:展示了四张算法运行的效果图;提到了使用的软件版本为VIVADO 2019.2和matlab 2022a;介绍了算法理论,即基于直方图的图像阈值分割,通过灰度直方图分布选取阈值来区分图像区域;并提供了部分Verilog代码,该代码读取图像数据,进行处理,并输出结果到&quot;result.txt&quot;以供MATLAB显示图像分割效果。