程序员如何用Python编程暴力算法破解凯撒密码

本文涉及的产品
密钥管理服务KMS,1000个密钥,100个凭据,1个月
简介:   破解凯撒密码可以用到一项密码分析技术,叫作暴力算法(brute-force),它的攻击是通过尝试每一种可能解密密文的密钥实现的。没有什么能够阻挡密码分析人员猜测密钥、用密钥解密密文、观察输出,并在没能破解出密文的情况下寻找下一把密钥。正因为这样的暴力算法对凯撒密码来说过于有效,所以在实际应用中根本不应该使用凯撒密码去加密一段秘密信息。  在理想的情况下,一段密文不会落入任何人的手中,然而Kerckhoffs原则(以19世纪密码学家Auguste Kerckhoffs命名)表明,一段密文即使在所有人都知道来源且某些人可能得到的情况下,也应该保持其安全性。20世纪时,数学家Claude S

  破解凯撒密码可以用到一项密码分析技术,叫作暴力算法(brute-force),它的攻击是通过尝试每一种可能解密密文的密钥实现的。没有什么能够阻挡密码分析人员猜测密钥、用密钥解密密文、观察输出,并在没能破解出密文的情况下寻找下一把密钥。正因为这样的暴力算法对凯撒密码来说过于有效,所以在实际应用中根本不应该使用凯撒密码去加密一段秘密信息。

  在理想的情况下,一段密文不会落入任何人的手中,然而Kerckhoffs原则(以19世纪密码学家Auguste Kerckhoffs命名)表明,一段密文即使在所有人都知道来源且某些人可能得到的情况下,也应该保持其安全性。20世纪时,数学家Claude Shannon在《香农格言》(Shannon's maxim)中重新提出了这个原则,即“敌人了解系统”。在密码算法中,是密钥保证了信息的机密性,而在凯撒密码中,密钥的信息非常容易被发现。

  本章要点Kerckhoffs原则和香农格言。暴力算法技术。range()方法。字符串标准化(字符串插值)。

  选中 File

  New File,打开一个新的编辑窗口,将下列代码输入编辑窗口并将其存储为caesarHacker.py。随后,如果读者的计算机中没有pyperclip.py模块,则可以下载它并将它放置在与caesarHacker.py相同的路径下(同一个文件夹中),该模块将在caesarHacker.py文件中被引入。

  结束文件配置后,按 F5键执行程序,如果代码中出现了报错或其他问题,请仔细比对书上代码和文件中代码有何不同。

  caesarHacker.py

  1. # 凯撒密码破解

  2. (BSD Licensed)

  3.

  4. message = 'guv6Jv6Jz!J6rp5r7Jzr66ntrM'

  5. SYMBOLS = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12345

  67890 !?.'

  6.

  7. # 循环遍历所有可能的关键字

  8. for key in range(len(SYMBOLS)):

  9.   # 将translated设置为空字符串很重要,这样可以清除上一个迭代中

  10.   # translated的值

  11.   translated = ''

  12.

  13.   # 程序的其余部分与凯撒程序几乎相同

  14.

  15.   # 循环遍历message中的每一个字符

  16.   for symbol in message:

  17.     if symbol in SYMBOLS:

  18.       symbolIndex = SYMBOLS.find(symbol)

  19.       translatedIndex = symbolIndex - key

  20.

  21.       # 执行回环

  22.       if translatedIndex < 0:

  23.         translatedIndex = translatedIndex + len(SYMBOLS)

  24.

  25.       # 添加解密的字符

  26.       translated = translated + SYMBOLS[translatedIndex]

  27.

  28.     else:

  29.       # 添加未加/解密的字符

  30.       translated = translated + symbol

  31.

  32.   # 显示每一个可能的解密值

  33.   print('Key #%s: %s' % (key, translated))

  注意,本段代码有很大一部分和原始的凯撒密码程序相同,这是因为凯撒密码的破解程序使用了和加密一样的步骤去解密信息。

  运行凯撒密码的破解程序,将会得到如下输出。它使用全部66种可能的密钥解密密文“guv6Jv6Jz!J6rp5r7Jzr66ntrM”,将其成功破解。

  Key #0: guv6Jv6Jz!J6rp5r7Jzr66ntrM

  Key #1: ftu5Iu5Iy I5qo4q6Iyq55msqL

  Key #2: est4Ht4Hx0H4pn3p5Hxp44lrpK

  Key #3: drs3Gs3Gw9G3om2o4Gwo33kqoJ

  Key #4: cqr2Fr2Fv8F2nl1n3Fvn22jpnI

  --snip--

  Key #11: Vjku?ku?o1?ugetgv?oguucigB

  Key #12: Uijt!jt!nz!tfdsfu!nfttbhfA

  Key #13: This is my secret message.

  Key #14: Sghr0hr0lx0rdbqds0ldrrZfd?

  Key #15: Rfgq9gq9kw9qcapcr9kcqqYec!

  --snip--

  Key #61: lz1 O1 O5CO wu0w!O5w sywR

  Key #62: kyz0Nz0N4BN0vt9v N4v00rxvQ

  Key #63: jxy9My9M3AM9us8u0M3u99qwuP

  Key #64: iwx8Lx8L2.L8tr7t9L2t88pvtO

  Key #65: hvw7Kw7K1?K7sq6s8K1s77ousN

  由于第13把密钥得到的输出是标准的英文,因此可以断定原始的加密密钥就是第13把密钥。

  破解程序生成了变量message,用于存储需要解密的密文字符串,常量SYMBOLS则包含了所有可以被加密的字符。

  1. # 凯撒密码破解

  2. # (BSD Licensed)

  3.

  4. message = 'guv6Jv6Jz!J6rp5r7Jzr66ntrM'

  5. SYMBOLS = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12345

  67890 !?.'

  SYMBOLS的值需要和凯撒密码加密程序中使用的SYMBOLS的减肥值完全相同,同时待破解的密文正是由该加密程序得来;否则,破解程序将失效。注意,SYMBOLS字符串中的 0 和 ! 之间有一个空格。

  第8行使用了一个for循环,然而它并没有在一个字符串值上进行迭代,而是在调用range()方法的返回值上进行迭代。

  7. # 循环遍历所有可能的关键字

  8. for key in range(len(SYMBOLS)):

  range()方法接收一个整型参数,并返回range数据类型的值。这种数据类型的值可以在for循环中用于进行指定次数的循环,循环次数由传递给range()方法的整数决定。尝试下面的例子,将下列代码输入交互式运行环境中。

  >>> for i in range(3):

  ...  print('Hello')

  ...

  Hello

  Hello

  Hello

  由于将整数3传递给了range()方法,因此for循环将进行3次循环。

  更确切地说,range()方法返回的range值会将for循环的变量值设置为0~输入的参数值(不包含后者),例如,将下列代码输入交互式运行环境中。

  >>> for i in range(6):

  ...  print(i)

  ...

  这段代码将变量i的值设置为0~6(不包含6),与caesarHacker.py文件的第8行类似——文件的第8行将key的值设置为0~66(不包含66)。为了避免将66直接硬编码到程序中,程序使用了len(SYMBOLS)的返回值,因此即使改变SYMBOLS的值,程序的运行也不会受到影响。

  程序首次执行到循环时,key被设置为0,message中的密文被密钥0解密(当然,如果0并不是真正的密钥,message会被解密为乱码)。for循环内部的第9~31行代码用于解密,并且与原始的凯撒密码加密程序类似,之后会对其进行解释。程序执行到下一次对for循环的迭代时,key被设置为1,继续进行解密。

  尽管这个程序中没有用到,读者还是可以尝试向range()方法中传递两个整型参数,而不像本程序中只使用了一个。第1个参数是range的起始值,第2个参数则是range的终值(range从起始值开始取值,但并不会取到终值),两个参数用逗号隔开。

  >>> for i in range(2, 6):

  ...  print(i)

  ...

  变量i的取值为2~6(含2而不含6)。

  for循环之下用于解密的代码,每次执行都将解密后的文本添加到translated字符串的末尾。在第11行,translated被置为空字符串。

  7. # 循环遍历所有可能的关键字

  8. for key in range(len(SYMBOLS)):

  9.   # 将translated设置为空字符串很重要,这样可以清除上一个迭代中

  10.   # translated的值

  11.   translated = ''

  在for循环的开始将translated置空非常重要,如果不这么做,则本次尝试的密钥解密出的文本将被添加到上一次迭代后生成的字符串后面。

  第16~30行和第5章中的凯撒密码加密程序几乎是相同的,但是要比第5章中的代码更简单一些,因为它们只被用作解密。

  13.   # 程序的其余部分与凯撒程序几乎相同

  14.

  15.   # 循环遍历message中的每一个字符

  16.   for symbol in message:

  17.     if symbol in SYMBOLS:

  18.       symbolIndex = SYMBOLS.find(symbol)

  在第16行中,程序循环遍历了message中存储的每一个字符。每经过一次循环迭代,第17行就检查symbol是否存在于常量SYMBOLS中,如果存在,就对其进行解密。第18行的find()方法对symbol在SYMBOLS中的位置进行确定,并将这个位置的值记录在变量symbolIndex中。

  随后,第19行从symbolIndex中减去key值进行解密。

  19.       translatedIndex = symbolIndex - key

  20.

  21.       # 执行回环

  22.       if translatedIndex < 0:

  23.         translatedIndex = translatedIndex + len(SYMBOLS)

  减法操作可能会导致translatedIndex的值小于0,这时就需要回到常量SYMBOLS的开头去寻找解密出的字符位置。第22行对可能的情况进行判断,如果出现了translatedIndex值小于0的情况,就为其加上66[len(SYMBOLS)的返回值]。

  translatedIndex的值改变后,SYMBOLS[translatedIndex]就可以获取解密得到的字符了。第26行将这个字符添加到translated存储的字符串末尾。

  25.       # 添加解密的字符

  26.       translated = translated + SYMBOLS[translatedIndex]

  27.

  28.     else:

  29.       # 添加未被加/解密的字符

  30.       translated = translated + symbol

  如果symbol的值没有在SYMBOLS中找到,则第30行将把它保持不变地添加到translated的结尾。

  虽然第33行是凯撒密码破解程序中唯一的一个print()方法,但它会得到多行执行结果,这是因为第8行的for循环每进行一次迭代,它就将被调用一次。

  32.   # 显示可能的解密值

  33.   print('Key #%s: %s' % (key, translated))

  print()方法中的参数是一个使用了字符串标准化(string formatting,也叫作字符串插值)的字符串。字符串标准化使用%s将一个字符串放置到另一个字符串当中,在这个字符串的结尾,第1个%s被括号中的第一个值替换。

  将下列代码输入交互式运行环境。

  >>> 'Hello %s!' % ('world')

  'Hello world!'

  >>> 'Hello ' + 'world' + '!'

  'Hello world!'

  >>> 'The %s ate the %s that ate the %s.' % ('dog', 'cat', 'rat')

  'The dog ate the cat that ate the rat.'

  本例中,首先将字符串world插入字符串“Hello %s!”,替换掉%s。这个过程和连接起%s之前、待插入的字符串、%s之后这三部分文本的过程是类似的,当需要插入多个字符串的时候,%s按照这些字符串的顺序被依次替换。

  字符串标准化往往比使用 + 操作符对字符串进行连接更便于输入,尤其是在面对长字符串的情况下。同时,与字符串连接不一样的是,使用字符串标准化甚至可以将非字符型的值(如整型)插入字符串中。将如下代码输入交互式运行环境。

  >>> '%s had %s pies.' % ('Alice', 42)

  'Alice had 42 pies.'

  >>> 'Alice' + ' had ' + 42 + ' pies.'

  Traceback (most recent call last):

  File "", line 1, in

  TypeError: Can't convert 'int' object to str implicitly

  使用字符串插值的时候,整数42可以非常顺利地插入字符串中,然而如果想要通过字符串连接将它插入字符串中,就会出现报错。

  caesarHacker.py文件的第33行使用字符串标准化生成了一个包含变量key和translated的字符串。由于key中存储的是一个整数的值,因此使用字符串标准化就可以将它作为字符串的值传递到print()方法中了。

  凯撒密码的致命弱点在于,用于加密的密钥并没有太多种可能性,任何计算机都可以轻易使用全部66种可能的密钥解密信息,密码分析人员只需要花几秒钟的时间浏览解密后的内容,就可以找到其中符合英文语法的一项。要使消息更安全,需要一种拥有更多可能密钥的算法,而在第7章中,移位密码就可以提供这样的安全性。

目录
相关文章
|
3天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
92 55
|
18天前
|
搜索推荐 Python
利用Python内置函数实现的冒泡排序算法
在上述代码中,`bubble_sort` 函数接受一个列表 `arr` 作为输入。通过两层循环,外层循环控制排序的轮数,内层循环用于比较相邻的元素并进行交换。如果前一个元素大于后一个元素,就将它们交换位置。
123 67
|
18天前
|
存储 搜索推荐 Python
用 Python 实现快速排序算法。
快速排序的平均时间复杂度为$O(nlogn)$,空间复杂度为$O(logn)$。它在大多数情况下表现良好,但在某些特殊情况下可能会退化为最坏情况,时间复杂度为$O(n^2)$。你可以根据实际需求对代码进行调整和修改,或者尝试使用其他优化策略来提高快速排序的性能
114 61
|
20天前
|
算法 数据安全/隐私保护 开发者
马特赛特旋转算法:Python的随机模块背后的力量
马特赛特旋转算法是Python `random`模块的核心,由松本真和西村拓士于1997年提出。它基于线性反馈移位寄存器,具有超长周期和高维均匀性,适用于模拟、密码学等领域。Python中通过设置种子值初始化状态数组,经状态更新和输出提取生成随机数,代码简单高效。
103 63
|
12天前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
83 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
19天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
18天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
29天前
|
机器学习/深度学习 算法 大数据
蓄水池抽样算法详解及Python实现
蓄水池抽样是一种适用于从未知大小或大数据集中高效随机抽样的算法,确保每个元素被选中的概率相同。本文介绍其基本概念、工作原理,并提供Python代码示例,演示如何实现该算法。
29 1
|
1月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
77 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
12天前
|
算法
基于WOA算法的SVDD参数寻优matlab仿真
该程序利用鲸鱼优化算法(WOA)对支持向量数据描述(SVDD)模型的参数进行优化,以提高数据分类的准确性。通过MATLAB2022A实现,展示了不同信噪比(SNR)下模型的分类误差。WOA通过模拟鲸鱼捕食行为,动态调整SVDD参数,如惩罚因子C和核函数参数γ,以寻找最优参数组合,增强模型的鲁棒性和泛化能力。