【26. 字符串哈希】

简介: **用到字符串的地方一般可以用KMP算法。用KMP算法的一般都可以用字符串哈希。代码更简单。**(特殊的哈希方式,字符串前缀哈希法)- 把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。(`比较俩个区间字符串前缀是否相等就变成了比较俩个区间字符串哈希是否相同`)### 核心- `以一个K进制的角度,来吧字符串看成数字。`

概述

  • 用到字符串的地方一般可以用KMP算法。用KMP算法的一般都可以用字符串哈希。代码更简单。(特殊的哈希方式,字符串前缀哈希法)
  • 把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。(比较俩个区间字符串前缀是否相等就变成了比较俩个区间字符串哈希是否相同

核心

  • 以一个K进制的角度,来吧字符串看成数字。

思路

  • 把每个字符串的前缀哈希求出来(预处理前缀哈希)
  • 求区间字符串的哈希,就用公式计算出字符串区间的哈希值
  • 计算俩个区间字符串是否相等就转换为俩个字符串哈希值是否相等

俩个问题:

问题1:我们如何定义某个前缀的哈希值

  • 对形如 X1X2X3⋯Xn - 1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。
  • 映射公式:(X1×Pn- 1+X2×Pn- 2+⋯+Xn -1×P1+Xn×P0) mod Q

字符串str = "ABCAB"
字符串 str 前缀有A AB ABC ABCA假设A~Z映射成下标1 ~ 26。
h[0] = 0
h[1] = "A"的hash值
h[2] = "AB"的hash值
h[3] = "ABC"的hsah值
h[4] = "ABCA"的hash值
前缀ABCA的哈希值 = (1 2 3 1 )p = (1 p3 + 2 p2 + 3 p1 + 1 p0)

步骤

  1. 把字符串看成p进制的数,字符串有10个字母,就看成10位数
  2. 把p进制的数转换为十进制的数
  3. 把求出来的数模上一个比较小的数Q(把任何一个字符串,映射到从0开始的自然数)

注意事项:

  • 任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
  • 冲突问题:通过巧妙设置P (131 或 13331) , Q (264)的值,此时几乎不会发生冲突。

问题2:前缀哈希有什么用处

  • 可以用前缀哈希通过一个公式算出任意子串的哈希

问题是比较不同区间的子串是否相同,就转化为对应的哈希值是否相同。

  • 求一个字符串的哈希值就相当于求前缀和,求一个字符串的子串哈希值就相当于求部分和。

前缀和公式: h[ i + 1]=h[i] × P + str[i] i∈[0,n−1]i∈[0,n−1] h为前缀和数组,str为字符串数组

区间和公式 :h[l,r]=h[r]−h[l−1]×Pr−l+1

区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
乘上 P2P2 把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。

题目

给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1,r1,l2,r2,请你判断 l1,r1 和 l2,r2 这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式

第一行包含整数 n 和 m,表示字符串长度和询问次数。

第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。

接下来 m 行,每行包含四个整数 l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从 1 开始编号。

输出格式

对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No

每个结果占一行。

数据范围

1≤n,m≤105

输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

代码

#include <iostream>
using namespace std;

using ULL = unsigned long long;
//typedef unsigned long long ULL;

const int N = 100010, P = 131;
int n, m;
char str[N];
ULL h[N], p[N];   //p[]主要是几次幂

// h[i]前i个字符的hash值
// 字符串变成一个p进制数字,体现了字符+顺序,需要确保不同的字符串对应不同的数字
// P = 131 或  13331 Q=2^64,在99%的情况下不会出现冲突
// 使用场景: 两个字符串的子串是否相同

ULL get(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}

int main()
{
    scanf("%d%d%s", &n, &m, str + 1);
    p[0] = 1;      //字符串从1开始编号,h[1]为前一个字符的哈希值
    h[0] = 0;
    for (int i = 1; i <= n; i ++)
    {
        p[i] = p[i - 1] * P;
        h[i] = h[i - 1] * P + str[i];   //前缀和求整个字符串的哈希值
       
    }
    while (m --)
    {
        int l1, r1, l2, r2;
        scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
        if (get(l1, r1) == get(l2, r2) )puts("Yes");
        else puts("No");
    }
   
    return 0;
}
目录
相关文章
|
4月前
|
算法 C#
Leetcode算法系列| 5. 最长回文子串
Leetcode算法系列| 5. 最长回文子串
|
5月前
|
算法
【算法总结】字符串哈希
【算法总结】字符串哈希
40 0
|
7月前
|
算法
next数组(详细求法)
next数组(详细求法)
142 0
|
10月前
杨氏矩阵,字符串左旋,字符串旋转结果题目解析
杨氏矩阵,字符串左旋,字符串旋转结果题目解析
|
12月前
字符串哈希
原题链接841. 字符串哈希 - AcWing题库 视频讲解AcWing 841. 字符串哈希 - AcWing
56 0
|
算法
算法:next数组的求法详解
算法:next数组的求法详解
767 0
算法:next数组的求法详解
|
算法 Java 索引
最长回文子串
最长回文子串
92 0
最长回文子串
|
算法
每日一题之字符串哈希
大家好,我是泡泡,给大家带来每日一题的目的是为了更好的练习算法,我们的每日一题这个月进度是数据结构,让大家练到各种各样的数据结构题目,熟悉数据结构的增删改查,一年以后,蜕变成为一个不一样的自己!
121 0
每日一题之字符串哈希
|
机器学习/深度学习 存储 容器
1044. 最长重复子串 :「字符串哈希 + 二分」&「后缀数组」
1044. 最长重复子串 :「字符串哈希 + 二分」&「后缀数组」