[里程碑]Eugene通过图灵测试背后的人工智能意义

简介:

昨天外媒传出,终于有一个计算机程序首次成功通过了图灵测试。这是一次属于计算机的胜利,一次颇具争议的胜利。依然有很多人站出来说,这并不算什么稀奇的事,毕竟通过比例只有 30%,而 Eugene 只取得了 3 个百分点高值。


那么究竟 Eugene通过了图灵测试代表了什么?对计算机,乃至对于人类意义有多大?来和我们一探究竟吧!


什么程序?

俄罗斯人 Vladimir Veselov 在俄罗斯的圣彼得堡开发的人工智能软件「Eugene」,通过了原版图灵测试。该软件模仿一个十三岁的小男孩,在回答图灵测试的测试者提出的问题时被认为其 33% 的答案是由人类给出的,而图灵测试的规则是如果这个比例超过 30% 即算通过。


这是「计算机之父」阿兰·图灵(Alan Turing)在 1950 年提出图灵测试理念之后首次有计算机控制的程序通过了该测试。经过了 64 年!里程碑式的事件!


那什么是图灵测试?

好问题。看来非常多的人对于图灵测试所具有的重大意义还是不太了解,或产生了根本性的混淆。


图灵测试的目的是用来测试它的测试对象——机器,是否达到了人工智能或人类感知的水平。当然,测试对象并不是《终结者》当中的天网那样的超级计算机系统。用最简单的话来描述的话,图灵测试的意义在评判一台机器是否能够成功的模仿人类。


跟 Siri 聊过天吗?如果你用过 WP 手机,你也一定觉得 Cortana 的智能水平已经非常不错了。图灵测试的通过标准线——30% 的问题答案被认为是人类回答——在很多人看来非常低。而事实上,能够通过图灵测试的人工智能系统,要比《全民公敌》(I,Robot)当中的机器人还要聪明和智能。


好吧,那为什么这次 Eugene 的胜利引起了这么大争议?

图灵测试本身并不是一个严格的针对计算机的测试,因为题目是由人提供,由人提问,由人判断答案的「类人性」的。聊天机器人有时候模仿人模仿的太像,以至于图灵测试的某些上了年纪的测试员也会相信他们的「鬼话」……


当然,这并不是说聊天机器人都能够轻易蒙混过关。图灵测试的测试员通常来自世界计算机科学界的顶尖科研人员。不过本次测试的审核委员会中,还有包括了著名科幻喜剧《红矮星号》的演员 Robert Llewellyn 和英国上院议员,自民党人士 Lord Sharkey。后面这两位尽管都是在文学、科技界声名显赫的「话题」人士,但对于人工智能方面的了解却并不能算「够资格」。


Eugene 通过图灵测试的方式也非常非常之取巧——既不是牛津大学的教授,也不是普通人,而是使用了一名十来岁男孩作为模仿对象——人类正常对话沟通的底限年龄。而且,还是一名讲俄语的男孩(英语是第二语言).


也就是说,Eugene 本次通过图灵测试,前提条件太多,大大降低了通过的难度,提高了可能性。是为很多人所不齿的一次胜利……


说了这么多,我们到底该不该关心这件事啊?

是这样的:即便如上所言,Eugene 也的确是通过了严格且科学的整个图灵测试的流程。Eugene 并不是第一个试图用投机取巧的方法来通过测试的聊天机器人,但的确是第一个真的通过了测试的。尽管 Eugene 面对的本次审核委员会并不能称得上是学术和研究经验最深厚的一拨人,但大部分的聊天机器人也不是用来专门跟计算机专家对话的呀!


因此,Eugene 通过图灵测试,的确是人工智能方面的一次重大突破。你应该为之感到……不管是激动还是恐惧,但至少不是怀疑。


如果你非要怀疑,那就怀疑图灵测试本身吧:这是一个主观、门槛够低,但仍然是人工智能业界的第一标准的一套测试工具。质疑 Eugene 为什么胜利就像是质疑足球赛的球门为什么那样宽一样……不是机器人的问题,而是游戏规则的问题。


那么现在该咋办?

别太担心,像终结者那样的智能机器人不会明天就出现在你家的门口,准备谋杀你。但 Eugene 通过图灵测试的事实,预示了我们距离能够被计算机模拟出的人工智能蒙混过关的日子越来越近了——即便他们装成了一个母语是俄语的 13 岁小男孩。


思想有多远,聊天机器人就能走多远。未来会出现能陪聊的机器人、能卖东西的机器人、能做爱的机器人,或者能陪聊还能做爱还能卖东西的机器人……


更重要的是,或许我们终于可以宣布把图灵测试放在过去,开始面对新的人工智能世界——天网和终结者了。


原文发布时间为:2014-06-11

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能革命:现状与未来展望
【10月更文挑战第2天】 本文深入探讨了人工智能在软件测试领域的应用现状、面临的挑战以及未来的发展方向。通过分析AI技术如何提高测试效率、准确性和自动化水平,文章揭示了AI在改变传统软件测试模式中的关键作用。同时,指出了当前AI测试工具的局限性,并对未来AI与软件测试深度融合的前景进行了展望,强调了技术创新对于提升软件质量的重要性。
83 4
|
4月前
|
人工智能 自然语言处理 测试技术
用图灵测试检验AI尤其是大语言模型,真的科学吗?
【9月更文挑战第25天】《Does GPT-4 Pass the Turing Test?》一文评估了先进AI模型GPT-4的图灵测试表现。尽管GPT-4在某些对话中成功迷惑了参与者,但其整体成功率仅为41%,低于人类的63%。图灵测试作为评估AI语言能力的工具依然有效,但存在局限性,如无法评估AI的认知机制且受主观判断影响。此外,测试还引发了关于AI智能及伦理的讨论。
226 6
|
4月前
|
数据采集 人工智能 安全
软件测试中的人工智能应用与挑战
在这篇文章中,我们将深入探讨人工智能(AI)在软件测试中的应用及其所面临的挑战。通过分析当前的技术趋势和具体案例,揭示AI如何提高测试效率和准确性,并指出在实施过程中遇到的主要问题及可能的解决途径。
77 1
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能:改变游戏规则的革新
在这篇技术性文章中,我们将深入探讨人工智能(AI)如何彻底改变了软件测试领域。从自动化测试到智能缺陷检测,AI不仅提高了测试的效率和准确性,还为软件开发团队提供了前所未有的洞察力。通过具体案例,本文揭示了AI在软件测试中应用的现状、挑战及未来趋势,强调了技术创新在提升软件质量与开发效率中的关键作用。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能:提升效率与准确性的新途径
在当今快速发展的技术领域,人工智能(AI)正成为软件测试的重要工具。本文将探讨AI在软件测试中的应用,如何通过智能化手段提高测试的效率和准确性。从自动化测试到缺陷预测,我们将深入了解AI如何改变传统的软件测试方式,为软件开发流程带来革命性的变化。
|
3月前
|
人工智能
反向和错位图灵测试:GPT-4比人类更人性化!
【10月更文挑战第8天】本文探讨了GPT-4在反向和错位图灵测试中的表现。反向测试中,GPT-4判断自身生成对话的准确性高于判断人类对话;错位测试中,人类更容易区分GPT-4生成的对话。研究揭示了GPT-4的某些特征及其局限性,如数据集偏差和任务特定性。
33 5
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能:现状与未来
【10月更文挑战第6天】 本文探讨了人工智能在软件测试中的应用,包括自动化测试、智能缺陷分析以及测试用例生成等方面。通过案例分析和未来趋势预测,文章展示了AI如何提高软件测试的效率和准确性,并指出了当前面临的挑战和未来的发展方向。
54 1
|
3月前
|
机器学习/深度学习 人工智能 算法
软件测试中的人工智能:现状与未来
本文探讨了软件测试领域中人工智能的当前应用和未来发展,分析了AI技术在提升测试效率、准确性和自动化方面的潜力。通过实例展示了AI如何帮助发现复杂缺陷,并展望了AI在软件测试中的进一步应用前景。
|
3月前
|
机器学习/深度学习 人工智能 监控
软件测试中的人工智能革命
本文探讨了人工智能在软件测试中的应用及其带来的变革。通过分析AI如何提高测试效率、准确性,并减少人工干预,本文揭示了软件测试领域的未来趋势。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
软件测试中的人工智能革命:效率与准确性的双重提升
随着人工智能技术的不断进步,软件测试领域正经历着前所未有的变革。本文将探讨人工智能在软件测试中的应用及其对效率和准确性的提升。我们将分析传统软件测试的局限性,展示AI如何通过自动化测试、智能缺陷识别和预测性维护来克服这些挑战。此外,我们还将讨论AI在测试过程中面临的伦理和安全挑战,以及如何应对这些挑战。通过综合分析,本文旨在为读者提供一个关于软件测试中人工智能应用的全面视角,强调其在提高效率和准确性方面的巨大潜力。
79 5