电脑识别图像的极限在何处?

简介:

电脑一直都很擅长视觉识别。有时它们识别一系列图像中某个个体的能力能够与人类相媲美。但相似的结果是否说明了电脑能够模拟人类的视觉系统呢?回答这个问题或许可能会发现电脑系统比不上人类的地方。


《美国科学院院刊》发表了一篇论文提到了电脑和人类视觉系统的不同。


最大的差别可以总结为电脑没有人脑灵活,这同样也是语言识别系统所面临的问题:人类可以通过支离破碎的单词推测出一句话或者一段话的意思而电脑不能。同样在图像识别方面:人类可以可以破碎的线索拼凑出模糊的图像,而电脑却不行。


论文的作者使用一组模糊、复杂的图像来确定计算机视觉模块与人类大脑的差异。他们使用的图像被称为“最小识别结构”(MIRCs)都是太小或者分辨率较低的图像再缩小一点人们都无法识别出来。


他们将这一系大小逐渐减小分辨率逐渐降低的图片呈现给Amazon Mechanical Turk上成千上万的人,确定出能够被人识别出来的最后一个等级的图片。最后一个等级的图片被称为MIRC,比它等级更低的无法识别出来的被称为sub-MIRC。


人和计算机最开始以及最明显的比较是MIRCs和sub-MIRCs的识别。为了测试这一点,研究人员识别出了65%的MIRCs图片,而sub-MIRCs的正确识别率则低于20%。电脑模块的表现则不是很好,它们可以正确的分类出7%的MIRCs和2%的sub-MIRCs。这次的胜利属于人类。


人和电脑在失败开始时的方式也是十分不同的。对于人来说,MIRCs的识别在某个特定的水平上呈现悬崖式的跌落。最后识别出来的图像能被93%的人正确识别,仅仅在一个细小的改变之后,sub-MIRC的图像只能被3%的人识别出来。


而电脑没有显示出这种急剧式的下跌。作者写到:“没有哪一个模块完全复制出人类识别过程中的急剧下跌。”


在经过专业训练后,计算机在识别MIRCs方面表现的更好些,但准确性比人类相比还是较低。关于原因作者说道,这是因为电脑无法识别出图像中的独立部分,但人类可以。例如,在一张模糊的图像中有鹰的头和翅膀,人们可以通过模糊的图像指认出眼睛、嘴或翅膀。作者提到,这种识别是“超过目前神经网络模块的能力”。


总的来说,电脑在图像识别上能做的很好,但并不是十分接近人类处理相同任务时的过程。它们无法使用图像中的独立部分进行信息识别,利用最少信息识别图像上它们不如人类。


为了让计算机模块更好的工作可能需要了解我们的大脑。人类在进行图像识别时,可能先猜测图像是什么,然后再寻找特性验证或反驳最初的想法。如果是这样的话,这与计算机模块的工作程序完全不同。


转自|煎蛋(www.jiandan.com)


往期精彩文章推荐,点击图片可阅读


眼动追踪技术,揭秘男女看点差异


机器视觉与深度神经网络—洗去浮华,一窥珠玑


原文发布时间为:2016-02-27

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
4月前
|
人工智能 小程序
【一步步开发AI运动小程序】五、帧图像人体识别
随着AI技术的发展,阿里体育等公司推出的AI运动APP,如“乐动力”和“天天跳绳”,使云上运动会、线上健身等概念广受欢迎。本文将引导您从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”。文章分为四部分:初始化人体识别功能、调用人体识别功能、人体识别结果处理以及识别结果旋转矫正。下篇将继续介绍人体骨骼图绘制。
|
10月前
|
机器学习/深度学习 人工智能 图计算
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
334 0
|
10月前
|
机器学习/深度学习 人工智能 算法
使用纹理对比度检测检测AI生成的图像
在本篇文章中我们将介绍如何开发一个深度学习模型来检测人工智能生成的图像
153 0
|
10月前
|
编解码 算法 安全
图像识别在轻轨轨道的损坏程度的分析
图像识别在轻轨轨道的损坏程度的分析
75 0
|
机器学习/深度学习 人工智能 中间件
智能图像分析-人像修复增强-艾科瑞特科技
智能图像分析-人像修复增强-艾科瑞特科技 艾科瑞特科技(iCREDIT)-全球最大的第三方软件中间件服务商 艾科瑞特科技官网:https://www.icredit.link 艾科瑞特科技云市场:https://market.icredit.link 艾科瑞特科技-Apifox-API Hub:https://apihub.icredit.link
|
文字识别 算法
使用光学字符识别算法识别图像中的七段数字
使用光学字符识别 (OCR) 识别图像中的七段数字。
201 0
|
机器学习/深度学习 人工智能 自然语言处理
了解面部识别的不同算法
任何面部检测和识别程序或系统都必须以人脸识别算法为核心。这些算法由专家分为两大类。几何方法专注于识别特征。为了从图像中提取值,应用了光度统计方法。然后,为了删除变体,将这些值与模板进行比较。此外,算法可以分为两组:基于特征的模型和整体模型。虽然整体方法将人脸视为一个整体,但前者侧重于面部特征并评估其空间特征并与其他特征的联系。
215 0
|
机器学习/深度学习
深度学习:不到25行代码实现口罩识别(电脑端可直接运行)
深度学习:不到25行代码实现口罩识别(电脑端可直接运行)
120 0
深度学习:不到25行代码实现口罩识别(电脑端可直接运行)
|
机器学习/深度学习
当深度学习搭上一双鞋,有人要用这检测你的压力水平!可无线操作,准确率达84%
当深度学习搭上一双鞋,有人要用这检测你的压力水平!可无线操作,准确率达84%
123 0
当深度学习搭上一双鞋,有人要用这检测你的压力水平!可无线操作,准确率达84%
|
机器学习/深度学习 存储 自动驾驶
计算机在识别图像时“看到”了什么?
计算机在识别图像时“看到”了什么?
194 0
计算机在识别图像时“看到”了什么?

热门文章

最新文章