参与科学测试的800个人工智能都难以及格,AI还需努力。
从2011年,Watson在问答节目Jeopardy上击败了最优秀的人类选手,到2016年谷歌的人工智能系统打败了欧洲围棋冠军,人们似乎对人工智能能够超越人类智慧的可能性就更加坚定了。2012年,IBM的人工智能系统Watson成功被克利夫兰诊所勒纳大学医学院录取,开始了它的医学研究生涯。医学生们希望Watson经过训练能够在对医学的理解能力上更进一步。但是,经过三年的训练,最终的结果似乎并不尽如人意。
Watson并没有通过美国八年级(相当于初二)的科学测试,严格来说并不符合医学院的录取条件,当初被允许进入医学部恐怕也有不少的水分存在。
华盛顿大学的计算机科学教授Oren Etzioni和艾伦人工智能研究所近期举办了一场比赛,邀请到800个人工智能团队,并将其AI系统进行八年级的科学测试。最终结果显示,表现最好的也就及格水平而已,可见大部分的人工智能系统的能力还不如八年级的学生。
这次长达五个月的测试足以可见人工智能的发展现状,深度神经网络的推出促进了人工智能的发展,再加上Google、Facebook、微软等在图像语音识别领域的迅速发展,已经使得人工智能达到了比较高的人类表现水平。但是想机器达到人类的思考水平,就目前的技术而言并不是一件现实的事,甚至连基本的对话功能与科学测试都不能满足,想要更进一步的发展还需不懈的努力。
科学测试是比问答节目、围棋比赛都难的一个项目,不仅包含知识的问答,还要求能够理解基本的概念。比如其中的一个多项选择问题:一些鱼类成熟后的多数时间都生活在盐水中,但会在淡水中产蛋。它们适应不同环境的能力是什么的最佳例证?机器人就无法解决,就算是使用神经网络也无法答出来。对此,Etzioni表示,自然语言的处理、推理、以及理解相关的概念都是非常复杂的问题,需要更多的推理运算才能够解决。
虽说参赛的大多数人工智能系统都是学术机构或是独立的研究员研发出来的,但是就算是巨头科技企业生产出来的产品应该也不会强太多。谷歌的表现可能会好一点,但是大众的集体智慧也同样不容小觑。
此次IBM拒绝参赛,对外的解释是由于对这样的比赛没有什么兴趣,现在关注的重点是现实世界问题的解决。此外,Watson也早已经不是最为合适的测试对象,以前是针对问答比赛,现在已经发展成为一系列人工智能工具的集合产品了,并不能充分代表大众的水平。
此次Etzioni的测试主要是对于语言处理的能力,可以了解机器对于人类语言的理解程度。现在IBM的服务也已经包含了自然语言的处理问题。而从Watson问世以来,该技术已经受到了深度神经网络的影响,就像是可以使用大量的猫咪图片教会神经网络识别猫一样,也可以使用对话来进行自然语言的理解训练。比如谷歌正在开发一种聊天机器人,可以和你探讨人生意义。
虽说这种聊天机器人的技术并没有什么信服力,但是现在的人工智能早已经不单单是一种技术,在未找到通用方法之前,就需要更多的机器学习和人工智能工具。但是尽管在此次的Etzioni测试中,参赛者已经使用了很多的工具,结果并不是非常地理想。
也有人表示让机器去进行科学测试并不具备太大的意义,应该关注更加深远的领域,多项选择、自然语言的理解、科学测试等等都不是人类应该追求的目标,真正要做的应该是智能程序可以自然掌握内容。当然,凭现在的技术,想要实现这个目标还需要更加的努力。