LeetCode:28. 找出字符串中第一个匹配项的下标

简介: 题目描述:给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。

🍎道阻且长,行则将至。🍓


🌻算法,不如说它是一种思考方式🍀


算法专栏: 👉🏻123


一、🌱28. 找出字符串中第一个匹配项的下标

  • 题目描述:给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
  • 来源:力扣(LeetCode)
  • 难度:中等
  • 提示:

1 <= haystack.length, needle.length <= 10^4^
haystackneedle 仅由小写英文字符组成

🌴解题

1.暴力法

暴力法只需要判断字符串 A 的子字符串目标字符串 needle 是不是相等即可;
i 遍历与目标字符串等长A 的子字符串haystack.substring(i,i+needle.length()) ==needle
注意到,这个遍历并不需要到字符串 A 的结尾,因为匹配长度的原因,遍历区间是 [0,haystack.length()-needle.length()]。

code:

class Solution {
    public int strStr(String haystack, String needle) {
        int ans=-1;
        for (int i = 0; i <= haystack.length()-needle.length(); i++) {
            if(haystack.substring(i,i+needle.length()).equals(needle)){
                return i;
            }
        }
        return ans;
    }
}

image.png

2.模式串匹配

KMP 算法

在前面使用暴力法匹配的时候是浪费了很多的匹配次数,就是指有一部分内容可以略过,不用从头开始:
image.png

例如上图中,遍历到第 7 个字符匹配 (b - c) 的时候,发现是不匹配的。按常规方法来说又得从字符串 A 第 2 个字符目标第一个字符开始往后面遍历,而实际上在 a b a 这一段开始的匹配是做的无用功,而有用的就是 (b - c) 前面匹配过的 a a
字符串 A 中的b前面的 a a(红框里)可以匹配上目标最前面的 a a ,字符串A的遍历就不必要回头,只有目标要返回;
例如下图:
image.png

即:找到目标串最前面和最后面相同的字串,这一部分不用重复,是已经验证过的。

有了前面的理解,我们就可以更好理解 KMP 算法了。
KMP 中的模式串就是目标字符串,而模式串(目标)如何回头——使用 next 数组,或说前缀表,来确定模式串的指针回到哪个位置。

前缀表就是记录一个最长公共前后缀,
前缀是指不包含最后一个字符的所有以第一个字符开头的连续子串;
后缀是指不包含第一个字符的所有以最后一个字符结尾的连续子串;
就是前缀==后缀的一个长度。

例如对于这个模式(目标)串,最长公共前后缀:
image.png

对于a:没有最长公共前后缀——0;
对于aa:第一个a和最后一个a——1;
对于aab:第一个a和最后一个b,不匹配——0;
对于aaba:第一个a和最后一个a——1;
对于aabaa:前面的aa和最后的aa——2,注意aab和baa、aaba和abaa不是相等的
...
那我们理解了这个概念,又如何用代码实现求 next 数组呢?

int[] next=new int[needle.length()];
int j=0;
next[j]=0;
for (int i = 1; i < needle.length(); i++) {
    while(j>0&&needle.charAt(j)!=needle.charAt(i)){
        j=next[j-1];
    }
    if(needle.charAt(j)==needle.charAt(i)){
        j++;
    }
    next[i]=j;
}

求 next 数组演示图:
kmp_next_1.gif

根据 next 数组模式匹配:

kmp_1.gif

code:

class Solution {
    public int strStr(String haystack, String needle) {
        int ans=-1;
        //计算前缀和next数组
        int[] next=new int[needle.length()];
        int j=0;
        next[j]=0;
        for (int i = 1; i < needle.length(); i++) {
            while(j>0&&needle.charAt(j)!=needle.charAt(i)){
                j=next[j-1];
            }
            if(needle.charAt(j)==needle.charAt(i)){
                j++;
            }
            next[i]=j;
        }

        //匹配
        j=0;
        for (int i = 0; i < haystack.length(); i++) {
            if(j< needle.length()) {
                if (haystack.charAt(i) == needle.charAt(j)) {
                    j++;
                } else if(j>0){
                    j = next[j - 1];
                    i--;
                }
            }
            if(j== needle.length()){
                ans=i-needle.length()+1;
                break;
            }
        }

        return ans;

    }
}

image.png


返回第一页。☝


☕物有本末,事有终始,知所先后。🍭

相关文章
|
27天前
|
JavaScript
力扣3333.找到初始输入字符串Ⅱ
【10月更文挑战第9天】力扣3333.找到初始输入字符串Ⅱ
32 1
|
1月前
|
C++
Leetcode第43题(字符串相乘)
本篇介绍了一种用C++实现的字符串表示的非负整数相乘的方法,通过逆向编号字符串,将乘法运算转化为二维数组的累加过程,最后处理进位并转换为字符串结果,解决了两个大数相乘的问题。
24 9
|
1月前
|
算法 C++
Leetcode第八题(字符串转换整数(atoi))
这篇文章介绍了LeetCode上第8题“字符串转换整数(atoi)”的解题思路和C++的实现方法,包括处理前导空格、正负号、连续数字字符以及整数溢出的情况。
17 0
|
1月前
【LeetCode 22】459.重复的子字符串
【LeetCode 22】459.重复的子字符串
28 0
|
1月前
【LeetCode 20】151.反转字符串里的单词
【LeetCode 20】151.反转字符串里的单词
19 0
|
1月前
【LeetCode 19】541.反转字符串II
【LeetCode 19】541.反转字符串II
20 0
|
1月前
【LeetCode 18】6.2.反转字符串
【LeetCode 18】6.2.反转字符串
14 0
|
3月前
|
存储 算法
LeetCode第43题字符串相乘
LeetCode第43题"字符串相乘"的解题方法,通过使用数组存储乘积并处理进位,避免了字符串转换数字的复杂性,提高了算法效率。
LeetCode第43题字符串相乘
|
3月前
|
算法 Java
LeetCode第28题找出字符串中第一个匹配项的下标
这篇文章介绍了LeetCode第28题"找出字符串中第一个匹配项的下标"的两种解法:暴力解法和KMP算法,并解释了KMP算法通过构建前缀表来提高字符串搜索的效率。
LeetCode第28题找出字符串中第一个匹配项的下标
|
3月前
|
算法
LeetCode第8题字符串转换整数 (atoi)
该文章介绍了 LeetCode 第 8 题字符串转换整数 (atoi)的解法,需要对字符串进行格式解析与校验,去除前导空格和处理正负号,通过从高位到低位的计算方式将字符串转换为整数,并处理越界情况。同时总结了这几道题都需要对数字的表示有理解。
LeetCode第8题字符串转换整数 (atoi)