AI解决密码学家终极挑战,600年未解伏尼契手稿有望破译

简介: 伏尼契手稿是一本内容不明的神秘书籍,里面充满着神秘的文字和插图。自从100多年前被发现以来,无数语言学家和密码学家对这部手稿进行了细致研究,但至今没有人能够破译出只言片语。现在,阿尔伯塔大学的NLP专家宣称利用AI技术能够破译这部天书。

伏尼契手稿是一本内容不明的神秘书籍,共240页,里面充满着编码一般的文字和神秘的插图。自从100多年前被发现以来,伏尼契手稿就一直令语言学家和密码学家困惑不解,至今没有人能够破译出只言片语。但最近,利用人工智能,加拿大的研究人员宣称在破译伏尼契手稿方面迈出了巨大的一步。

伏尼契手稿(Voynich manuscript)的书名来自名为威尔弗雷德·伏尼契(Wilfrid Voynich)的波兰书商,他于1912年在意大利买下此手稿。手稿中使用的字母和语言都是未知的,至今无人能识别。伏尼契手稿包含数百页纸张,部分书页散失了,书中手写的文字是从左到右书写的。大部分页面都配有插图,插图内容包括植物、任务和天文符号。但至于文字的含义——完全不懂。没有任何线索。

但并不是缺少尝试去破译手稿的人。这部手稿被认为是世界上最重要的密码,自被发现以来,无数专业和业余的译解密码者都仔细地研究过它。在第二次世界大战期间,顶尖的密码专家也对它进行过分析,但即使是他们也没有破译出只字片语。有关这本手稿,人们提出了各种各样的理论,例如它是用半随机加密方案创建的;它是字谜;或者是一种元音被移除的书写系统。有人甚至认为这份手稿是一场精心策划的骗局。

ef2383b3429d3bd3011c46af407e6d1832ce1cc8

伏尼契手稿(图:耶鲁大学贝尼克珍本与手稿图书馆)

但对于阿尔伯塔大学自然语言处理专家格雷格·康德拉克(Greg Kondrak)来说,破解这本天书似乎是非常适合AI的任务。在他的研究生Bradley Hauer的帮助下,Greg Kondrak在破解伏尼契手稿密码方面迈出了一大步。他们发现文本是用希伯来语编写的,并且字母以某个固定的模式排列。虽然研究人员还不知道伏尼契手稿中内容的含义,但现在已经准备好让其他专家参与调查。

第一步是找出加密文本的语言。为此,AI研究了“世界人权宣言”的文本,这是用380种不同的语言编写而成,试图找到模式。经过这一步的训练,AI分析手稿的乱码文字,得出的结论是,文字很可能是用经过编码的希伯来语写成的。 Kondrak和Hauer都大吃一惊,因为他们刚开始这个项目时,认为这些文字是用阿拉伯语写的。

Kondrak说:“这真令人惊讶。但是,得出‘这是希伯来语’只是第一步,下一步是破译出文本的含义。

e335e83477ad921250d25aa7f589312b36214a96

伏尼契手稿中的一页(图:耶鲁大学贝尼克珍本与手稿图书馆)

第二步,研究人员接受了以前的研究人员提出的假设,即手稿的文本是基于字母表创建的,也就是说,文本已经被按字母顺序排列的字母表替换(例如,GIZMODO重排后变成DGIMOOZ)。基于文本最初是用希伯来语编码这个发现,研究人员设计了一个算法,可以利用这些变位词来创造出真正的希伯来语单词。

Kondrak说,“我们发现,有80%以上的单词都在希伯来语词典中,但是我们不知道它们组合在一起是否有意义。”

最后一步,研究人员决定了手稿的开头部分,并将它交给Moshe Koppel,以为计算机科学家兼母语是希伯来语的人。Koppel说,这在希伯来语中并不能形成一个连贯的句子。

研究人员在报告中写道:“但是,在进行了一些拼写校正之后,谷歌翻译能够将它翻译成可接受的英语:’她向牧师、家人以及我和其他人提了建议’(She made recommendations to the priest, man of the house and me and people)”,相关报道发表在ACM网站中。

对于一部240页的书来说,以这样一个句子开头是挺奇怪的,但这句话实际上是有意义的。研究人员并没有说他们已经破译了整部伏尼契手稿。但他们确定了手稿的语言(希伯来语),以其中字母以特定的字母表顺序排列这样一种编码方案。Kondrak说,只有等到古希伯来的历史学家有机会研究破译的文本,才能知道手稿的全部意思。

令人兴奋的是,该团队正在计划将新算法应用到其他古老的手稿,AI有潜力解决困扰人类几个世纪的问题。


原文发布时间为:2018-02-1

本文作者:马文

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:AI解决密码学家终极挑战,600年未解伏尼契手稿有望破译

相关文章
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|
机器学习/深度学习 数据采集 人工智能
AI揭示生命密码:如何个性化生存概率预测?
接下来的章节将进一步探讨AI技术在个性化乳腺癌预测中的应用,以及未来的发展方向。
339 0
|
机器学习/深度学习 传感器 人工智能
盗取密码,AI表示只需20秒!通过拍摄热图像确定字母和顺序,成功率高达86%
最近,国内首部以网络安全为题材的作品《你安全吗?》大火。 电视剧中呈现了只有做不到没有想不到的种种黑客攻击手段,随之而来的便是网友们对自己网络安全的种种担忧。
166 0
盗取密码,AI表示只需20秒!通过拍摄热图像确定字母和顺序,成功率高达86%
|
机器学习/深度学习 人工智能 算法
一周AI最火论文 | 童年的手绘漫画有望复兴?AI建立草稿到模型映射
一周AI最火论文 | 童年的手绘漫画有望复兴?AI建立草稿到模型映射
237 0
首个AI国际标准有望明年出台,创新工场等多家国内公司已参与
联邦学习为人工智能领域绝大多数需要训练数据聚合、交换的场景,提供了目前的最完整的技术体系支持。
340 0
|
人工智能 安全 算法
AI + 医疗的下一个十年:从公共卫生预警到人类基因密码破解
医疗事关人身安全,要求极高,容错率极低,因此,知识壁垒和技术壁垒都很高。过去,AI 系统更多的是服务于终端,辅助医生诊断、决策。但是,医疗很复杂,直接切入终端问题很多。未来十年,AI+医疗会碰撞出怎样的火花,AI 对医疗产业、医护人员、患者等会产生怎样的影响?
|
机器学习/深度学习 人工智能 算法
“精灵鼠小弟”成真!AI破解小鼠表情密码,证明150年前达尔文之问
日前,Science刊登了来自马普神经生物学研究所科学家的新研究:首次利用机器学习算法破译了小鼠的面部表情。不仅成功区分小鼠高兴、恐惧、恶心、疼痛等表情,还测量出对应情绪的强度。这项研究对精确定位人脑中表达特定情绪的神经元有着重要意义。
|
机器学习/深度学习 人工智能 自动驾驶
吴恩达:模拟人脑,未来AI执行精神层面任务有望快过人类!
AI在未来如何实现真正的“智能”?这个问题似乎遭遇瓶颈。目前深度学习对人类大脑的模拟仍然处于初级阶段,是否应该沿这条路继续走下去?吴恩达认为,通过深度学习模拟大脑,未来的AI能够比人类更快地完成精神层面的任务。也有研究人员认为,应从大自然中寻找灵感,让AI建立关于世界的“心理模型”。
1406 0
|
人工智能 算法 机器人
探索新型化学反应的AI机器人诞生!有望加速药物发现 | Nature论文
近日,来自格拉斯哥大学(University of Glasgow)的研究人员完成了一项新研究:他们训练出了一个人工智能驱动的有机化学合成机器人,从而使探索大量化学反应的过程实现自动化。
2142 0
|
机器学习/深度学习 人工智能
【75位联合作者Nature重磅】AI药神:机器学习模型有望提前五年预测白血病!
来自全球多家科研机构的75位科学家在《自然》发表了一项重磅研究:使用血液检测和机器学习技术,可以预测健康个体是否有患急性骨髓性白血病(AML)的风险。这项研究意味着我们可以提早发现AML的高风险人群并进行监测,同时可以进行研发,寻找降低该疾病患病几率的方案。
1425 0