【基础算法训练】—— 哈希表

简介: 【基础算法训练】—— 哈希表

知识铺垫——真的分得清哈希表吗


什么是哈希表


简单的来说,哈希表是一种表结构,我们可以直接根据给定的key值计算出目标位置。通常是采用数组实现了

与普通的列表不同的地方在于,普通列表仅能通过下标来获取目标位置的值,而哈希表可以根据给定的key计算得到目标位置的值。

在列表查找中,使用最广泛的二分查找算法,复杂度为O(log2n),但其始终只能用于有序列表。普通无序列表只能采用遍历查找,复杂度为O(n)。而拥有较为理想的哈希函数实现的哈希表,对其任意元素的查找速度始终为常数级,即O(1)。


下面浅看一下官方对哈希表的描述吧。

C++里一般不直接使用这个库函数的,只是这种映射的思想比较重要,很多时候咱们数组模拟的哈希表其实也就是实现这个思想。


假如想手动实现核心的散列函数,这儿有两种比较常用的方式,可以作为积累,但是现在很少手动实现了吧

一、拉链法

image.png二、开放寻址法

微信图片_20221019203926.png

set 和 unordered_set

微信图片_20221019204050.png


map 和 unordered_map


微信图片_20221019204117.png

set 和 map的区别

微信图片_20221019204150.png


第一题 1512. 好数对的数目


哈希表+组合数学


题目描述

微信图片_20221019204254.png

解题报告


看到这种数据范围,啊,拿出可爱的暴力


题目让咱们求的是组合的情况,题目要求i < j这个条件我感觉可以忽视吧,只要有数列中有个相同的数字,就直接可以组合成数对了,大不了在书写的时候,写成i < j的模式。

让咱们求相同的数,两两组合的情况,比如现在有4个相同的数(样例二),

两两组合的情况是C 4 2 C_{4}^2C 42= 4 * (4-1) / 2 = 6,符号样例二的输出结果

其他的相同数字两两组合的情况,也可以使用类似的方式计算出来的,在计算之前,咱们只是需要使用哈希表来统计数列中每个数出现的次数。


参考代码(C++版本)


解法一

class Solution {
public:
    int numIdenticalPairs(vector<int>& nums) {
        int n = nums.size();
        int ans = 0;
        for(int i = 0; i < n;i++)
            for(int j = i+1;j < n;j++)
            {
                if(nums[i] == nums[j] && i < j) 
                    ans ++;
            }
        return ans;
    }
};

解法二:

class Solution {
public:
    int numIdenticalPairs(vector<int>& nums) {
        //哈希表+组合数学
        int cnt[110];
        memset(cnt,0,sizeof(cnt));
        int n = nums.size();
        //统计给的数列中,每个数出现的情况
        for(int i = 0; i < n;i++)
            cnt[nums[i]] ++;
        int ans = 0;
        for(int i = 0; i < 110;i++)
        //如果统计到某个数的个数至少有两个,那么就可以进行组合
        //比如有三个1,组合的情况就是(3*2)/2 = 3
            if(cnt[i] > 1)
            {
                ans += cnt[i]*(cnt[i]-1) / 2;
            }
        return ans;
    }
};

第二题 2006. 差的绝对值为 K 的数对数目


题目描述

微信图片_20221019204444.jpg

解题报告


题目的意思是去查找某个结果的时候,哈希表O(1)的时间复杂度或者二分O(logN)时间复杂度就可以多留意一下了。


对于本题而言,其实是让我们去统计满足要求的数字的个数,那咱们就可以使用一个哈希表,在将各个数值出现的次数统计出来的同时,按照题目要求的|nums[i] - nums[j]| = k,计算满足要求的数值的个数。

题目给的限制是|nums[i] - nums[j]| = k

将绝对值展开了,可以得到两个式子:

nums[i] = nums[j] + k

nums[i] = nums[j] - k

那咱们其实可以使用j作为下标从左到右遍历,统计是否有满足条件的i,倘若有就把其个数进行统计。


参考代码(C++版本)


解法一

class Solution {
public:
    int countKDifference(vector<int>& nums, int k) {
        int ans = 0, n = nums.size();
        for (int i = 0; i < n; ++i) 
            for (int j = i + 1; j < n; ++j) 
                if (abs(nums[i] - nums[j]) == k) ans ++;
        return ans;
    }
};

解法二:

class Solution {
public:
    int countKDifference(vector<int>& nums, int k) {
        unordered_map<int,int>h;
        int ans=0;
        int n = nums.size();
        for(int j = 0;j < n;j++)
        {
            h[nums[j]] ++;
            ans += h[nums[j] + k];
            ans += h[nums[j] - k];
        }
        return ans;
    }
};

第三题 1347. 制造字母异位词的最小步骤数


题目描述

image.jpeg

解题报告


题目其实就是想要咱们求,将t字符串中的字母变成和s字符串中相同的字母(不论位置),最少需要变换几个字符。

这个思路就很直接了吧,直接使用哈希表统计两个字符串中各个字母出现的情况,然后统计对于某个字符而言,t字符串中比s字符串中多的数量,这个多出来的部分,就是需要进行变换的数量。


参考代码(C++版本)

class Solution {
public:
    int minSteps(string s, string t) {
        //直接将两个字符串哈希,然后统计不同的字符的个数就是答案
        int n1 = s.size();
        int cnts[26],cntt[26];
        memset(cnts,0,sizeof(cnts));
        memset(cntt,0,sizeof(cntt));
        for(int i = 0; i < n1;i++)
        {
            cntt[t[i] - 'a'] ++;
            cnts[s[i] - 'a'] ++;
        }
        int ans = 0;
        for(int i = 0; i < 26;i++)
            if(cnts[i] < cntt[i]) ans += cntt[i] - cnts[i];
        return ans;
    }   
};

第四题 面试题 10.02. 变位词组


排序+常规情况的变型


题目描述

微信图片_20221019204729.png

解题报告


好家伙,数据范围都不放呢

这个题应该是属于小变型吧,之前咱们接触是映射字符,统计数量,比如将asdffdska存到哈希表unordered_map<char,int>中,其效果统计对应的字符的数量,字符a的数量是两个,字符d的数量是1个。

对于这个题而言了,是使用 unordered_map<string,vector<string>>统计相同字符串的不同形式,比如字符串aei的不同形式eia、aie等等。最本质的想法是一个的


参考代码(C++版本)

class Solution {
public:
    vector<vector<string>> groupAnagrams(vector<string>& strs) {
        //其本质来说了,有点换汤不换药,因为之前统计的时候
        //可以用哈希表统计某个相同的字母出现的次数
        //这里了,统计某个相同的字符串
        vector<vector<string>> ans;
        unordered_map<string,vector<string>> mp;
        int n = strs.size();
        for(int i = 0; i < n;i++)
        {
            string str = strs[i];
            //对取出的字符串进行排序
            sort(str.begin(),str.end());
            //把相同的字符串加入到哈希表中
            mp[str].push_back(strs[i]);
        }
        //遍历这个哈希表统计结果,这里需要使用迭代器进行遍历了
        //倘若手写是这种的
        // unordered_map<string,vector<string>> :: iterator it;
        //倘若偷懒,是直接循环里放auto。遇事不决,我用auto...
        for(auto it = mp.begin(); it != mp.end(); it++)
            ans.push_back(it->second);
        return ans;
    }
};

总结


总结了,哈希表和字符串是好朋友

相关文章
|
17天前
|
存储 算法 安全
探究‘公司禁用 U 盘’背后的哈希表算法与 Java 实现
在数字化办公时代,信息安全至关重要。许多公司采取“禁用U盘”策略,利用哈希表算法高效管理外接设备的接入权限。哈希表通过哈希函数将设备标识映射到数组索引,快速判断U盘是否授权。例如,公司预先将允许的U盘标识存入哈希表,新设备接入时迅速验证,未授权则禁止传输并报警。这有效防止恶意软件和数据泄露,保障企业信息安全。 代码示例展示了如何用Java实现简单的哈希表,模拟公司U盘管控场景。哈希表不仅用于设备管理,还在文件索引、用户权限等多方面助力信息安全防线的构建,为企业数字化进程保驾护航。
|
3月前
|
算法 Java 数据库
数据结构与算法学习十五:哈希表
这篇文章详细介绍了哈希表的概念、应用实例、实现思路,并提供了使用Java实现的哈希表代码。
84 0
数据结构与算法学习十五:哈希表
|
9天前
|
存储 监控 算法
员工电脑监控屏幕场景下 Python 哈希表算法的探索
在数字化办公时代,员工电脑监控屏幕是保障信息安全和提升效率的重要手段。本文探讨哈希表算法在该场景中的应用,通过Python代码例程展示如何使用哈希表存储和查询员工操作记录,并结合数据库实现数据持久化,助力企业打造高效、安全的办公环境。哈希表在快速检索员工信息、优化系统性能方面发挥关键作用,为企业管理提供有力支持。
37 20
|
18天前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
22天前
|
存储 监控 JavaScript
深度探秘:运用 Node.js 哈希表算法剖析员工工作时间玩游戏现象
在现代企业运营中,确保员工工作时间高效专注至关重要。为应对员工工作时间玩游戏的问题,本文聚焦Node.js环境下的哈希表算法,展示其如何通过快速查找和高效记录员工游戏行为,帮助企业精准监测与分析,遏制此类现象。哈希表以IP地址等为键,存储游戏网址、时长等信息,结合冲突处理与动态更新机制,确保数据完整性和时效性,助力企业管理层优化工作效率。
30 3
|
22天前
|
存储 算法 安全
基于哈希表的文件共享平台 C++ 算法实现与分析
在数字化时代,文件共享平台不可或缺。本文探讨哈希表在文件共享中的应用,包括原理、优势及C++实现。哈希表通过键值对快速访问文件元数据(如文件名、大小、位置等),查找时间复杂度为O(1),显著提升查找速度和用户体验。代码示例展示了文件上传和搜索功能,实际应用中需解决哈希冲突、动态扩容和线程安全等问题,以优化性能。
|
28天前
|
存储 监控 算法
企业内网监控系统中基于哈希表的 C# 算法解析
在企业内网监控系统中,哈希表作为一种高效的数据结构,能够快速处理大量网络连接和用户操作记录,确保网络安全与效率。通过C#代码示例展示了如何使用哈希表存储和管理用户的登录时间、访问IP及操作行为等信息,实现快速的查找、插入和删除操作。哈希表的应用显著提升了系统的实时性和准确性,尽管存在哈希冲突等问题,但通过合理设计哈希函数和冲突解决策略,可以确保系统稳定运行,为企业提供有力的安全保障。
|
30天前
|
存储 缓存 算法
探索企业文件管理软件:Python中的哈希表算法应用
企业文件管理软件依赖哈希表实现高效的数据管理和安全保障。哈希表通过键值映射,提供平均O(1)时间复杂度的快速访问,适用于海量文件处理。在Python中,字典类型基于哈希表实现,可用于管理文件元数据、缓存机制、版本控制及快速搜索等功能,极大提升工作效率和数据安全性。
63 0
|
3月前
|
存储 机器学习/深度学习 算法
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
蓝桥杯Python编程练习题的集合,涵盖了从基础到提高的多个算法题目及其解答。
143 3
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
|
2月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。