【26. 字符串哈希】

简介: **用到字符串的地方一般可以用KMP算法。用KMP算法的一般都可以用字符串哈希。代码更简单。**(特殊的哈希方式,字符串前缀哈希法)- 把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。(`比较俩个区间字符串前缀是否相等就变成了比较俩个区间字符串哈希是否相同`)### 核心- `以一个K进制的角度,来吧字符串看成数字。`

概述

  • 用到字符串的地方一般可以用KMP算法。用KMP算法的一般都可以用字符串哈希。代码更简单。(特殊的哈希方式,字符串前缀哈希法)
  • 把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。(比较俩个区间字符串前缀是否相等就变成了比较俩个区间字符串哈希是否相同

核心

  • 以一个K进制的角度,来吧字符串看成数字。

思路

  • 把每个字符串的前缀哈希求出来(预处理前缀哈希)
  • 求区间字符串的哈希,就用公式计算出字符串区间的哈希值
  • 计算俩个区间字符串是否相等就转换为俩个字符串哈希值是否相等

俩个问题:

问题1:我们如何定义某个前缀的哈希值

  • 对形如 X1X2X3⋯Xn - 1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。
  • 映射公式:(X1×Pn- 1+X2×Pn- 2+⋯+Xn -1×P1+Xn×P0) mod Q

字符串str = "ABCAB"
字符串 str 前缀有A AB ABC ABCA假设A~Z映射成下标1 ~ 26。
h[0] = 0
h[1] = "A"的hash值
h[2] = "AB"的hash值
h[3] = "ABC"的hsah值
h[4] = "ABCA"的hash值
前缀ABCA的哈希值 = (1 2 3 1 )p = (1 p3 + 2 p2 + 3 p1 + 1 p0)

步骤

  1. 把字符串看成p进制的数,字符串有10个字母,就看成10位数
  2. 把p进制的数转换为十进制的数
  3. 把求出来的数模上一个比较小的数Q(把任何一个字符串,映射到从0开始的自然数)

注意事项:

  • 任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
  • 冲突问题:通过巧妙设置P (131 或 13331) , Q (264)的值,此时几乎不会发生冲突。

问题2:前缀哈希有什么用处

  • 可以用前缀哈希通过一个公式算出任意子串的哈希

问题是比较不同区间的子串是否相同,就转化为对应的哈希值是否相同。

  • 求一个字符串的哈希值就相当于求前缀和,求一个字符串的子串哈希值就相当于求部分和。

前缀和公式: h[ i + 1]=h[i] × P + str[i] i∈[0,n−1]i∈[0,n−1] h为前缀和数组,str为字符串数组

区间和公式 :h[l,r]=h[r]−h[l−1]×Pr−l+1

区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位,
乘上 P2P2 把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。

题目

给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1,r1,l2,r2,请你判断 l1,r1 和 l2,r2 这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式

第一行包含整数 n 和 m,表示字符串长度和询问次数。

第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。

接下来 m 行,每行包含四个整数 l1,r1,l2,r2,表示一次询问所涉及的两个区间。

注意,字符串的位置从 1 开始编号。

输出格式

对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No

每个结果占一行。

数据范围

1≤n,m≤105

输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

代码

#include <iostream>
using namespace std;

using ULL = unsigned long long;
//typedef unsigned long long ULL;

const int N = 100010, P = 131;
int n, m;
char str[N];
ULL h[N], p[N];   //p[]主要是几次幂

// h[i]前i个字符的hash值
// 字符串变成一个p进制数字,体现了字符+顺序,需要确保不同的字符串对应不同的数字
// P = 131 或  13331 Q=2^64,在99%的情况下不会出现冲突
// 使用场景: 两个字符串的子串是否相同

ULL get(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}

int main()
{
    scanf("%d%d%s", &n, &m, str + 1);
    p[0] = 1;      //字符串从1开始编号,h[1]为前一个字符的哈希值
    h[0] = 0;
    for (int i = 1; i <= n; i ++)
    {
        p[i] = p[i - 1] * P;
        h[i] = h[i - 1] * P + str[i];   //前缀和求整个字符串的哈希值
       
    }
    while (m --)
    {
        int l1, r1, l2, r2;
        scanf("%d%d%d%d", &l1, &r1, &l2, &r2);
        if (get(l1, r1) == get(l2, r2) )puts("Yes");
        else puts("No");
    }
   
    return 0;
}
目录
相关文章
|
监控 Cloud Native 安全
浅谈云原生可观测性
【1月更文挑战第23天】
|
4月前
|
人工智能 弹性计算 机器人
阿里云无影云电脑已上线Clawdbot(Moltbot)专属镜像,1键部署Moltbot AI 助手教程
阿里云无影云电脑已上线Moltbot(原Clawdbot)专属镜像,镜像预装VS Code、TMUX、钉钉、WPS等常用组件,支持钉钉、QQ等软件唤醒,无需复杂环境配置,3步即可部署完成。这款AI智能助理能操作文件、处理工作、联动多工具,同时打通网关与云电脑,帮助用户快速创建个人Agent。目前更多相关技能正在持续解锁,企业微信等接入能力也在加速适配中。
1847 0
|
设计模式 前端开发 JavaScript
自动化测试框架设计原则与最佳实践####
本文深入探讨了构建高效、可维护的自动化测试框架的核心原则与策略,旨在为软件测试工程师提供一套系统性的方法指南。通过分析常见误区,结合行业案例,阐述了如何根据项目特性定制自动化策略,优化测试流程,提升测试覆盖率与执行效率。 ####
503 6
|
JavaScript NoSQL 关系型数据库
当下弹幕互动游戏源码开发教程及功能逻辑分析
当下很多游戏开发者或者想学习游戏开发的人,想要了解如何制作弹幕互动游戏,比如直播平台上常见的那种,观众通过发送弹幕来影响游戏进程。需要涵盖教程的步骤和功能逻辑的分析。
|
机器学习/深度学习 人工智能 算法
【AI系统】内存分配算法
本文探讨了AI编译器前端优化中的内存分配问题,涵盖模型与硬件内存的发展、内存划分及其优化算法。文章首先分析了神经网络模型对NPU内存需求的增长趋势,随后详细介绍了静态与动态内存的概念及其实现方式,最后重点讨论了几种节省内存的算法,如空间换内存、计算换内存、模型压缩和内存复用等,旨在提高内存使用效率,减少碎片化,提升模型训练和推理的性能。
784 1
|
缓存 小程序 API
微信小程序网络请求与API调用:实现数据交互
本文深入探讨了微信小程序的网络请求与API调用,涵盖`wx.request`的基本用法、常见场景(如获取数据、提交表单、上传和下载文件)及注意事项(如域名配置、HTTPS协议、超时设置和并发限制)。通过一个简单案例,演示了如何实现小程序与服务器的数据交互。掌握这些技能将帮助你构建功能更丰富的应用。
|
存储 Java 编译器
01.计算机组成原理和结构
计算机组成原理涵盖底层硬件知识与冯·诺依曼体系结构,包括CPU、内存、I/O设备等硬件组成,强调理论与实践结合。冯·诺依曼架构定义了存储程序计算机,涉及运算器、控制器、存储器及I/O设备,影响现代计算机设计。学习时需理解数据交互、流动与控制层面,掌握控制器、存储器、运算器工作原理。计算机组成原理不仅关注硬件细节,如数字电路和数据表示,还探讨软件与硬件交互,如编译过程和操作系统功能。学习方法建议通过提问串联知识点、以教带学及编写示例程序验证理论,旨在全面理解计算机运作机制。
790 0
|
Go
Golang语言基础之标识符和变量定义
这篇文章详细介绍了Go语言中标识符和变量的定义、命名规则、关键字、变量类型、声明方式、作用域等基础知识。
259 3
|
数据采集 安全 大数据
隧道代理的定义与应用指南
隧道代理是一种特殊的代理服务,它允许用户通过固定的服务器IP和端口访问互联网。在这个过程中,云端服务器负责自动切换IP地址,从而实现匿名访问。这种服务使用高性能主机构建的动态IP代理服务器,使开发者无需管理IP池,降低了开发难度和部署成本。
507 1
|
安全 API 数据安全/隐私保护
API安全性最佳实践
API安全性最佳实践
604 1

热门文章

最新文章