计算机过了图灵测试,噱头大于实际

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 在英国皇家学会举办的图灵测试中,一台由俄罗斯工程师设计的机器(更准确的说是软件)成功通过测试,成为有史以来第一台通过图灵测试的机器。很多科技媒体高呼人工智能即将进入新时代,显然,他们太乐观了。

什么是图灵测试?


图灵测试一词来源于计算机科学和密码学的先驱——阿兰图灵写于1965年的一篇论文《计算机器与智能》( ComputingMachinery and Intelligence),图灵认为:机器能否思考的重要标准就是是否可以模仿一个真正的人。于是图灵设计了一套测试规则:


“如果一个人A使用测试对象皆理解的语言去询问两个他不能看见的对象任意一串问题。对象为:一个是正常思维的人B、一个是机器C。”


图灵测试会有多个像A一样的测试者去轮番“轰炸”测试对象,图灵设定了30%的下限——即如果有30%的测试者认为无法分辨和他交流的到底是机器还是人,则该机器通过图灵测试。


在本次由英国皇家学会的测试中,共有5个参赛者。获胜者——“尤金”被33%的测试者认定为“人类”,且大多数的测试者相信它是一个“13岁的乌克兰男孩”。一位该机器(软件)的开发者弗拉基米尔·维西罗夫表示:“我们的主要设计理念是,它可以声称它什么都知道,但由于受年龄限制,实际上它并不是什么都知道,这是完全合理的。”


这条消息再次引发人类对于机器的恐惧,但机器通过图灵测试真的能宣布人功智能时代即将到来吗?


我看未必,至少短时间内不会。


自然语言制约机器的进步


参加图灵测试的计算机涉及到多个技术,其中就包括自然语言,自然语言包括自然语言生成系统和自然语言理解系统,前者是把计算机数据转化为自然语言,后者则是把自然语言转化为计算机程序更易于处理的形式。总之一句话,自然语言是人类与机器交流的重要媒介。


在图灵测试中,人与机器交流方式就是自然语言理解和生成的过程,或者更准确的说,人与机器交互的方式都是自然语言实现的流程。这是人与机器交流的第一步,只有让机器先懂得人的看法,后面才会涉及大数据、云计算之类技术。而就在此次测试“成功通过之前”,Google产品经理Dave Orr坦言:自然语言还有待发展,目前只是处在“可以使用”的阶段,很多互联网公司都开始用自然语言开发一些看起来很酷的产品,比如siri、Google now,但如果你非要说机器可以“理解”你的意思,那的确有点勉为其难。


机器对语言的理解到底有多笨?有个经典案例说让机器分辨下面两句话:“我们把香蕉给猴子,因为它们饿了”和“我们把香蕉给猴子,因为它们熟透了”。这两句话的结构是一样的,虽然语义有所差别,正常人理解起来也没有太大问题。但机器就理解不了,两个“它们”就足够让机器们陷入“沉思”,也给不出正确的结果。


Dave Orr举了一个例子说“让机器试着用几句话总结一篇文章的要义”,至少到目前为止,还没有那个机器可以做到这一点。而本次通过图灵测试的机器(软件)则是历经十余年年的“精心培育”,也因此不具备大规模复制的能力。


从这个角度来说,即使有机器(计算机)通过图灵测试,倘若没有自然语言处理以及其他相关技术的快速跟进,人类在接下来很长一段时间内还无法实现所谓的人工智能。


相关文章
|
6月前
|
人工智能 自然语言处理 测试技术
用图灵测试检验AI尤其是大语言模型,真的科学吗?
【9月更文挑战第25天】《Does GPT-4 Pass the Turing Test?》一文评估了先进AI模型GPT-4的图灵测试表现。尽管GPT-4在某些对话中成功迷惑了参与者,但其整体成功率仅为41%,低于人类的63%。图灵测试作为评估AI语言能力的工具依然有效,但存在局限性,如无法评估AI的认知机制且受主观判断影响。此外,测试还引发了关于AI智能及伦理的讨论。
313 6
|
5月前
|
人工智能
反向和错位图灵测试:GPT-4比人类更人性化!
【10月更文挑战第8天】本文探讨了GPT-4在反向和错位图灵测试中的表现。反向测试中,GPT-4判断自身生成对话的准确性高于判断人类对话;错位测试中,人类更容易区分GPT-4生成的对话。研究揭示了GPT-4的某些特征及其局限性,如数据集偏差和任务特定性。
54 5
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
|
机器学习/深度学习 人工智能 自然语言处理
【AI Business Model】人工智能的定义 | 了解 AI 的历史 | 简单理解什么是 “图灵测试“
【AI Business Model】人工智能的定义 | 了解 AI 的历史 | 简单理解什么是 “图灵测试“
204 1
|
10月前
|
人工智能 自然语言处理 安全
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
【5月更文挑战第27天】GPT-4在图灵测试中达到54%的胜率,使人类无法辨别其身份,展示出强大的人工智能模拟人类行为的能力。这项由UCSD进行的研究超越了ELIZA的22%,但未及人类67%的真实水平。尽管成果显著,图灵测试的局限性及AI伦理问题也随之浮现,引发关于技术控制与安全性的讨论。该进展预示着人工智能在客户服务等领域有广阔应用前景。[[arXiv:2405.08007](https://arxiv.org/pdf/2405.08007)]
138 1
|
10月前
|
人工智能 数据安全/隐私保护
图灵测试
图灵测试 “【5月更文挑战第20天】”
427 1
|
人工智能
图灵测试
图灵测试
307 0
|
机器学习/深度学习 人工智能 自然语言处理
最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试
最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试
133 0
|
传感器 人工智能 自然语言处理
亚马逊Alexa科学家:图灵测试70年已成古董,要给AI构建新的「黄金标准」了!
【新智元导读】1950 年,图灵提出著名的「图灵测试」去回答「机器能否思考」的问题,目的是判断机器是否能表现出人类也无法区分的对话行为。70年来,图灵测试也一直作为学术界的AI「北极星」而存在。近日,亚马逊语音助手 Alexa 部门的首席科学家认为,人们现在关心的是人机之间的互动,而不是区分机器和人类。他认为,图灵测试过时了,AI 需要新基准测试!
337 0
亚马逊Alexa科学家:图灵测试70年已成古董,要给AI构建新的「黄金标准」了!
|
机器学习/深度学习 人工智能 算法
JMC | 分子生成器的图灵测试
JMC | 分子生成器的图灵测试
309 0
JMC | 分子生成器的图灵测试

热门文章

最新文章