基础算法

简介: 本章介绍基础算法,涵盖加密与排序两大类。加密部分包括对称加密(如AES、SM4)、非对称加密(如RSA、SM2)、哈希摘要(如SHA-2、SM3)、电子签名及密码安全存储方案(如加盐、BCrypt)。排序部分讲解常见算法:冒泡、快排、归并、堆排序等,分析其时间复杂度与适用场景,并区分比较类与非比较类排序方法,强调实际应用中多采用混合策略以提升效率。(239字)

第二章 基础算法
1、加密算法
1.1【问】请介绍一下你知道的加密算法
参考回答:
一般分类如下
对称加密
非对称加密
哈希摘要
电子签名
密码存储
其中
对称加密常见的有:DES、AES 等,国家标准有 SM4
非对称加密常见的有:RSA,ECDSA 等,国家标准有 SM2
哈希摘要有:MD5、SHA-2、SHA-3 等,国家标准有 SM3
电子签名有:通常会结合 RSA、ECDSA 和哈希摘要完成签名,或者是 HMAC
密码存储:直接使用哈希摘要作为密码存储、加盐存储、BCrypt
1.2【追问】解释对称加密、非对称加密、哈希摘要
对称加密
加密和解密的密钥使用同一个
因为密钥只有一个,所以密钥需要妥善保管
加解密速度快
非对称加密
密钥分成公钥、私钥,其中公钥用来加密、私钥用来解密
只需将私钥妥善保管,公钥可以对外公开
如果是双向通信保证传输数据安全,需要双方各产生一对密钥
A 把 A公钥 给 B,B 把 B公钥 给 A,他们各自持有自己的私钥和对方的公钥
A 要发消息给 B,用 B公钥 加密数据后传输,B 收到后用 B私钥 解密数据
类似的 B 要发消息给 A,用 A公钥 加密数据后传输,A 收到后用 A私钥 解密数据
相对对称加密、加解密速度慢
哈希摘要,摘要就是将原始数据的特征提取出来,它能够代表原始数据,可以用作数据的完整性校验
举个例子,张三对应着完整数据
描述张三时,会用它的特征来描述:他名叫张三、男性、30多岁、秃顶、从事 java 开发、年薪百万,这些特征就对应着哈希摘要,以后拿到这段描述,就知道是在说张三这个人
为什么说摘要能区分不同数据呢,看这段描述:还是名叫张三、男性、30多岁、秃顶、从事 java 开发、月薪八千,有一个特征不符吧,这时可以断定,此张三非彼张三
1.3【追问】解释签名算法
电子签名,主要用于防止数据被篡改。
先思考一下单纯用摘要算法能否防篡改?例如
发送者想把一段消息发给接收者
中途 message 被坏人改成了 massage(摘要没改)
但由于发送者同时发送了消息的摘要,一旦接收者验证摘要,就可以发现消息被改过了
坏人开始冒坏水
但摘要算法都其实都是公开的(例如 SHA-256),坏人也能用相同的摘要算法
一旦这回把摘要也一起改了发给接收者,接收者就发现不了
怎么解决?
发送者这回把消息连同一个密钥一起做摘要运算,密钥在发送者本地不随网络传输
坏人不知道密钥是什么,自然无法伪造摘要
密钥也可以是两把:公钥和私钥。私钥留给发送方签名,公钥给接收方验证签名,参考下图
注意:验签和加密是用对方公钥,签名和解密是用自己私钥。不要弄混
1.4【追问】你们项目中密码如何存储?
首先,明文肯定是不行的
第二,单纯使用 MD5、SHA-2 将密码摘要后存储也不行,简单密码很容易被彩虹表攻击,例如
攻击者可以把常用密码和它们的 MD5 摘要结果放在被称作【彩虹表】的表里,反查就能查到原始密码
加密结果
原始密码
e10adc3949ba59abbe56e057f20f883e
123456
e80b5017098950fc58aad83c8c14978e
abcdef
...
...
因此
要么提示用户输入足够强度的密码,增加破解难度
要么我们帮用户增加密码的复杂度,增加破解难度
可以在用户简单密码基础上加上一段盐值,让密码变得复杂
可以进行多次迭代哈希摘要运算,而不是一次摘要运算
还有一种办法就是用 BCrypt,它不仅采用了多次迭代和加盐,还可以控制成本因子来增加哈希运算量,让攻击者知难而退
1.5【追问】比较一下 DES、AES、SM4
它们都是对称加密算法
DES(数据加密标准)使用56位密钥,已经不推荐使用
AES(高级加密标准)支持 128、192、256位密钥长度,在全球范围内广泛使用
SM4(国家商用密码算法)支持 128位密钥,在中国范围内使用
1.6【追问】比较一下 RSA、ECDSA 和 SM2
它们都是非对称加密算法
RSA 的密钥长度通常为 1024~4096,而 SM2 的密钥长度是 256
SM2 密钥长度不需要那么长,是因为它底层依赖的是椭圆曲线、离散对数,反过来 RSA 底层依赖的是大数分解,前者在相同安全级别下有更快的运算效率
SM2 是中国国家密码算法,在国内受政策支持和推广
ECDSA 与 SM2 实现原理类似
2、排序
2.1 【问】请介绍一下你知道的排序算法有哪些
初级答法
常见的排序算法有:冒泡排序、选择排序、插入排序、快速排序、归并排序、堆排序等
P.S.
适合对以上排序算法一知半解,不太自信的同学,所谓言多必失,回答基本的就行
但要对接下来【各种排序的时间复杂度】的追问做到心中有数,这个必须背一背(参考后面的表格)
进阶答法
排序算法大致可分为两类:
A. 基于比较的排序算法
B. 非比较排序算法
比较排序算法有:快排、归并、堆排序、插入排序等
非比较排序算法有:计数排序、桶排序、基数排序等
比较排序算法中
快排、归并、堆排序能够达到 $$O(n \cdot \log{n})$$的(平均)时间复杂度
而插入排序的(平均)时间复杂度是 $$O(n^2$$
但并不是说复杂度高的算法就差,这要看数据规模和数据有序度,例如
数据量小,或是有序度高的数据就适合用插入排序
同样是数据量大的数据排序,如果数据的有序度高,归并优于快排
快排虽然是比较排序中最快的算法,但若是分区选取不好,反而会让排序效率降低
工业级的排序都是混合多种排序算法,例如 java 排序的实现就是混合了插入、归并与快排,不同的数据规模、不同场景下切换不同的排序算法
至于计数、桶、基数可以达到进一步让时间复杂度降至$$O(n$$,当然这与被排序数字的位数、范围等都有关系,您想知道的话,咱们可以细聊。
P.S.
适合对这些排序算法非常熟悉的同学,这时应注重回答的条理性
首先,对算法进行简单分类,让答案更为清晰
其次,不要等面试官来继续追问,而是主动回答各个算法的时间复杂度和适用场景,体现你对它们的熟悉
第三,一定要对各个算法的细节有充分准备,否则问到答不出来就尴尬了,这时不如降级为【初级答法】

相关文章
|
2月前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
572 165
|
2月前
|
存储 JSON NoSQL
MongoDB常用命令
本节介绍MongoDB常用命令,涵盖数据库的创建与删除(use、show dbs、dropDatabase)、集合操作(显式/隐式创建、drop)及文档的CRUD。以articledb数据库和comment集合为例,演示数据插入语法及注意事项,如NumberInt使用、_id自动生成等,帮助快速掌握MongoDB基础操作。(239字)
|
2月前
|
机器学习/深度学习 人工智能 监控
构建AI智能体:六十五、模型智能训练控制:早停机制在深度学习中的应用解析
文章摘要:早停机制是深度学习中防止过拟合的关键技术,通过在验证集性能停止改善时终止训练,自动平衡模型复杂度和泛化能力。其核心价值包括自动防过拟合、提升训练效率(节省30-80%计算资源)、简化调参过程。关键参数设置涉及patience(容忍轮次)、min_delta(最小改善阈值)和restore_best_weights(恢复最佳权重)。实现流程包括训练轮次监控、验证集评估和性能改善判断,通过U型曲线分析可直观理解其工作原理。
353 20
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
基于深度学习+NLP豆瓣电影数据爬虫可视化推荐系统
本研究构建基于深度学习与NLP的豆瓣电影数据系统,融合LSTM、BERT与CNN技术,实现高效爬取、情感分析、个性化推荐与动态可视化,提升影视数据分析效率与推荐精准度,推动产业智能化升级。
|
2月前
|
供应链 搜索推荐 API
1688图片搜索相似商品API指南
1688图片搜索相似商品API基于图像识别技术,支持通过图片查找平台内相似商品,提供商品信息与相似度评分,适用于以图搜货、比价、供应链寻源等场景,提升采购效率。
|
2月前
|
数据采集 SQL 自然语言处理
脏数据不脏心:大数据平台的数据质量(DQ)入门实战与自动修复心法
脏数据不脏心:大数据平台的数据质量(DQ)入门实战与自动修复心法
258 20
|
2月前
|
人工智能 运维 安全
SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道
SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道
252 15
|
2月前
|
安全 Cloud Native Serverless
2025数字员工技术选型白皮书:阿里云/亚马逊等5款产品云原生能力实测
本文深度评测阿里云、亚马逊、科大讯飞、玄晶引擎、安恒五款数字员工,围绕架构兼容性、开发友好度、性能稳定性三大维度,结合实测数据与企业案例,为开发者提供选型指南与避坑建议。
361 5
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
数据中台的进化之路:从“管数据”到“懂业务”
数据中台的进化之路:从“管数据”到“懂业务”
282 3