美国西北大学新系统在智力测试中超越75%民众,人类的推理能力也不及AI了?

简介:

美国西北大学新系统在智力测试中超越75%民众,人类的推理能力也不及AI了?

你听过瑞文氏标准推理测试(Raven’s Progressive Matrices)么?上面这张图就是一道标准的瑞文氏测试题目,是不是很眼熟?在公务员考试、一般的智力测试中我们经常看到它。

那么问题来了,你知道图中这道题的答案么?如果不知道,也用不着沮丧,因为有75%的美国人大概也不知道。但坏消息是:计算机可能知道。

近日,美国西北大学的科研团队研发了一个全新的计算模型,在瑞文氏标准推理测试中达到或超越了75%美国普通大众的表现。被媒体誉为人工智能史上的又一里程碑。

要知道,根据2016年的数据显示,一般18岁成年人的平均智商为97,6岁儿童的平均智商为55.5,相比之下谷歌人工智能系统的智商则为47.3,微软小冰是24.5。人工智能的智商还不及6岁儿童的平均水平。

团队负责人,来自西北大学McCormick工程学院的Ken Forbus教授对此表示:“模型在智力测试中的表现优于75%的美国大众,这意味着人工智能的逻辑推理能力已经高于人类的平均水平,起码在测试题中如此。另外,由于对人来说很难的题目对模型来说通常也很难,这表示该模型已经可以表现出一些人类认知系统中特有的重要属性。”

美国西北大学新系统在智力测试中超越75%民众,人类的推理能力也不及AI了?

Ken Forbus教授

实力这么强,这个模型到底是如何工作的呢?

据悉,该模型建立在一个名为CogSketch的“草图”(sketch)理解系统之上,该系统同样是Ken Forbus团队的研究成果。这里“草图”是指人们在思考问题或表达观点时自然而然在纸上画下来的说明性图样,特别是面对有关空间理解和地理学的相关问题时,尤其必要。CogSketch系统可以基于草图进行空间建模和逻辑推理,再配合此次最新研发的计算模型,因而能够在瑞文氏标准推理测试中脱颖而出。

Ken Forbus教授认为类比推理是解决视觉问题的核心,团队正是在这一核心思想的指导下研发了最新的计算模型。所谓类比推理即结构映射的过程,是在不同对象之间通过逐个匹配,寻找它们在结构上的相似点,从而通过图式归纳(即关系结构表征)把源问题中元素之间的关系要素提取出来,用于靶问题的解决。也就是说,先要形成基于源问题的图式归纳,再基于源问题和靶问题之间的结构映射将图式归纳应用到靶问题的解决。在新的计算模型中,团队成员利用了结构映射理论来对比不同的图像,通过标记两张图像中发现的相同结构,识别出其中的相同点和不同点。值得一提的是,结构映射是由心理学家Dedre Gentner于1983年提出的一个理论,他也是西北大学的教授。

针对西北大学的这项研究,雷锋网随机采访了两位相关专业的在读研究生,他们表达了自己的看法。

钟超杰是来自北京林业大学的硕士在读生,曾参与车载摄像头的行人检测项目。他认为,虽然模型的智力测试成绩超过了75%的人类,但这并不能说明计算机的智力真的就超过了人类。因为除了推理之外,智力的含义应该更复杂,比如还包括学习能力、数学计算能力等。而且他觉得如果模型建的好,经过一定数据量的训练,计算机处理这类问题的能力一般是可以超过人类的,但超出这类问题的范畴应该就不行了。

周志敏是来自浙江大学的研二在读生,了解机器学习领域的各种算法,包括svm、神经网络等。他认为这是人工智能针对特定任务的又一项成功应用,跟人类的类比、推理能力并不一样。西北大学的模型之所以表现出超过75%普通民众的推理能力,是因为它经过了大量的类似数据的训练,如果让它做图形之外的工作应该就不行了。

当前,人工智能系统对图像和语音的识别能力已经相当出色,但对于语义和图像含义的理解、推理能力仍有待提高。西北大学的团队表示,在许多场景中除了对源数据进行识别之外,对其含义的推理和解释也至关重要,这也是他们研发全新的计算模型并对其展开瑞文氏标准推理测试的原因。他们希望这项研究成果可以为计算机视觉领域今后的发展提供一些技术参考。

本文作者:恒亮

本文转自雷锋网禁止二次转载,原文链接

雷锋网

相关文章
|
1天前
|
机器学习/深度学习 数据采集 人工智能
构建一个基于AI的文本分类系统
【6月更文挑战第1天】构建基于AI的文本分类系统涉及数据预处理、特征提取、模型训练和预测。步骤包括:收集标注文本,进行预处理(清洗、分词、去停用词);使用词袋模型、TF-IDF或词嵌入提取特征;选择并训练模型(如朴素贝叶斯、SVM、CNN等);评估优化模型性能;最后部署模型进行预测,并定期更新维护。未来,关注点将扩展至模型的鲁棒性、可解释性和安全性。
|
1天前
|
机器学习/深度学习 人工智能 安全
探索软件测试的新时代:AI驱动的测试自动化
本文深入探讨了人工智能(AI)如何革新软件测试领域,特别是测试自动化。随着AI技术的不断进步,它为测试自动化带来了前所未有的效率和准确性,从而极大地提高了软件开发的速度和质量。本文将详细介绍AI在软件测试中的应用,以及它如何帮助测试人员克服传统测试方法的局限性。
|
1天前
|
机器学习/深度学习 人工智能 测试技术
探索软件测试的新时代:AI与自动化的融合
【5月更文挑战第31天】本文探讨了人工智能和自动化技术如何革新软件测试领域,提高效率与准确性。我们将分析这些技术如何帮助测试人员更快地识别软件缺陷,预测潜在问题,并优化测试流程。
|
1天前
|
机器学习/深度学习 人工智能 算法
探索软件测试的新维度:AI与自动化的融合
【5月更文挑战第31天】本文深入探讨了人工智能(AI)与自动化在软件测试领域的结合应用,揭示了这一趋势如何革新传统的测试流程,提升效率和准确性。通过分析AI技术在缺陷预测、测试用例生成和结果分析等方面的应用,文章展示了AI如何帮助测试人员识别更复杂的问题,减少人为错误,并缩短产品上市时间。
|
2天前
|
JavaScript Java 测试技术
基于ssm+vue.js的在线测试管理系统附带文章和源代码设计说明文档ppt
基于ssm+vue.js的在线测试管理系统附带文章和源代码设计说明文档ppt
3 0
|
2天前
|
人工智能 自然语言处理 安全
构建未来:AI驱动的自适应网络安全防御系统提升软件测试效率:自动化与持续集成的实践之路
【5月更文挑战第30天】 在数字化时代,网络安全已成为维护信息完整性、保障用户隐私和企业持续运营的关键。传统的安全防御手段,如防火墙和入侵检测系统,面对日益复杂的网络攻击已显得力不从心。本文提出了一种基于人工智能(AI)技术的自适应网络安全防御系统,该系统能够实时分析网络流量,自动识别潜在威胁,并动态调整防御策略以应对未知攻击。通过深度学习算法和自然语言处理技术的结合,系统不仅能够提高检测速度和准确性,还能自主学习和适应新型攻击模式,从而显著提升网络安全防御的效率和智能化水平。 【5月更文挑战第30天】 在快速迭代的软件开发周期中,传统的手动测试方法已不再适应现代高效交付的要求。本文探讨了如
|
2天前
|
JavaScript Java 测试技术
基于SpringBoot+Vue+uniapp的在线测试管理系统的详细设计和实现(源码+lw+部署文档+讲解等)
基于SpringBoot+Vue+uniapp的在线测试管理系统的详细设计和实现(源码+lw+部署文档+讲解等)
|
3天前
|
机器学习/深度学习 传感器 人工智能
构建未来:AI技术在智能交通系统中的应用
【5月更文挑战第30天】 在快速发展的人工智能领域,智能交通系统作为一个高度集成了多种AI技术的应用平台,正在逐步改变我们的出行方式。本文将深入探讨AI技术在智能交通系统中的关键作用,包括实时数据分析、预测模型构建、自动驾驶车辆以及交通管理优化等方面。通过对当前技术的深度分析与未来趋势的展望,文章旨在提供一个全面的视角,理解AI如何塑造交通的未来。
|
3天前
|
Dart 前端开发 测试技术
移动应用开发的未来:跨平台框架与原生系统的融合深入理解软件测试中的持续集成与持续部署(CI/CD)
【5月更文挑战第30天】 在本文中,我们将深入探讨移动应用开发领域的最新趋势:跨平台开发框架与原生操作系统的融合。随着移动设备成为日常生活的核心,高效、灵活且性能卓越的应用程序需求日益增长。文章分析了当前主流的跨平台工具如React Native和Flutter,并探讨了它们如何与iOS和Android等原生系统相互作用,以及这种融合对开发者、用户和整个移动生态系统意味着什么。我们还将预测未来可能的技术发展,并提出相应的策略建议。
|
3天前
|
人工智能 测试技术
探索软件测试的未来:AI与自动化的融合
随着技术的不断进步,软件测试领域正经历着一场革命。本文将探讨人工智能(AI)和自动化如何改变传统的软件测试方法,提高测试效率和准确性。我们将深入了解这些技术如何帮助测试人员更好地识别和修复缺陷,以及它们对未来软件质量的影响。

热门文章

最新文章