计算机视觉和人类视觉有相似的不足

简介: 计算机视觉和人类视觉有相似的不足

深卷积神经网络浪潮席卷人工智能领域。这些程序在某些方面能比人类做得更好,从面部和物体识别到玩古老的游戏--围棋等。


神经网络受到了由大脑结构的启发。机器视觉背后得深卷积神经网络的结构和大脑负责视觉得结构之间有着惊人的相似之处。其中的一个进化了数百万年,另一个是仅发展了短短几十年。但似乎都以同样的方式工作。


这引发了一个有趣的问题,如果机器视觉和人类视觉用类似的方式工作,他们是否也有同样的不足?人类和机器是否不能解决同样的视觉挑战?

dddd.jpg

首先是一些背景信息。在脑中负责视力的神经在有很多层,他们被认为从图像中提取逐步的详细信息,如运动,形状,颜色,等等。每一层是一个庞大的神经元网络。

深卷积神经网络具有类似的结构。他们也有层的结构,并且每个层由模仿大脑神经元的电路结构组成,神经网络的术语就是这么来的。


经过多次试验,计算机科学家们发现,这些神经网络层识别图像最好的时候,每个层逐步地提取更多信息。而且当他们看每个层的单独行为时,他们发现和大脑神经层有显著的相似性。

sssssssssssssss.jpg

为了找到答案,Kheradpisheh 教授和他的合作人员用了四种物件的识别难度各异的图片,然后测试人类和深卷积神经网络的识别能力。


该团队让 89 个人每人识别 960 个图像。研究人员使用每个实验者反应的速度和准确性作为他们识别图片的测量。


该小组还在两个用于物体识别的最强大的深度卷积网络进行了等效试验,一个在加拿大多伦多大学开发,另一个在牛津大学开发。


结果是非常有趣的。 “我们发现,人类和深卷积神经网络很大程度上每一种变化的相对困难程度详细,” Kheradpisheh教授说 “3d旋转是迄今为止最难识别的,其次是放大缩小,然后在平面内旋转。”


这结果显示了使用卷积神经网络来帮助探测人类认知过程的可能性。这项技术或许可以在某些图像的设计中应用,如空中交通管制,紧急出口,使用救生设备等的指令等。

相关文章
|
机器学习/深度学习 算法 数据挖掘
计算机视觉五大核心研究任务全解:分类识别、检测分割、人体分析、三维视觉、视频分析
计算机视觉五大核心研究任务全解:分类识别、检测分割、人体分析、三维视觉、视频分析
2005 1
|
机器学习/深度学习 人工智能 监控
探索视觉AI:超越计算机视觉的边界
【8月更文挑战第20天】
196 2
|
编解码 机器人 测试技术
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
413 8
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
496 3
|
机器学习/深度学习 人工智能 固态存储
深度学习在计算机视觉中的应用:重塑视觉感知的未来
【7月更文挑战第1天】深度学习重塑计算机视觉未来:本文探讨了深度学习如何革新CV领域,核心涉及CNN、RNN和自注意力机制。应用包括目标检测(YOLO、SSD等)、图像分类(VGG、ResNet等)、人脸识别及医学影像分析。未来趋势包括多模态融合、语义理解、强化学习和模型可解释性,推动CV向更高智能和可靠性发展。
|
机器学习/深度学习 算法 计算机视觉
计算机视觉是一门研究如何使计算机“看”的技术,其目标是让计算机能够像人类视觉一样理解和解释视觉信息。
计算机视觉是一门研究如何使计算机“看”的技术,其目标是让计算机能够像人类视觉一样理解和解释视觉信息。
|
机器学习/深度学习 开发框架 决策智能
计算机视觉实战 (一) 开个视觉实战专栏
计算机视觉实战 (一) 开个视觉实战专栏
350 0
|
机器学习/深度学习 测试技术 计算机视觉
【计算机视觉 | ViT-G】谷歌大脑提出 ViT-G:缩放视觉 Transformer,高达 90.45% 准确率
谷歌大脑提出 ViT-G:缩放视觉 Transformer,高达 90.45% 准确率
|
传感器 监控 自动驾驶
计算机视觉(Computer Vision,CV)是一门研究如何使机器“看”并理解视觉世界的科学与技术。
计算机视觉(Computer Vision,CV)是一门研究如何使机器“看”并理解视觉世界的科学与技术。
|
机器学习/深度学习 算法 数据挖掘
计算机视觉五大核心研究任务全解:分类识别、检测分割、人体分析、三维视觉、视频分析
计算机视觉五大核心研究任务全解:分类识别、检测分割、人体分析、三维视觉、视频分析
635 0

热门文章

最新文章