从神经科学到计算机视觉:人类与计算机视觉五十年回顾

简介: 本文简单的介绍了神经网络近50年的发展历程,从1968年的Hubel和Wiesel开展的猫实验,一直到李飞飞教授等人的成果。从本质上讲解了人工神经网络的原理及学习过程,对于想了解神经网络起源及发展历程的读者而言,是一篇较为合适的文章。

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud

如何像人类大脑一样完成一项视觉任务是复杂的,比如深度感知、目标跟踪边缘检测扫描环境和定位是大脑经常做的事情,这些都被人们认为是理所当然的事情在过去某段时间里,研究者们可能从来没有想过创建类似人类大脑处理任务一样的系统。然而,在过去的50年中,我们已经从神经科学中看似一些的突破转向能够描述图片场景的电脑

在神经科学课程教学过程中,有很多趣闻发生以帮助同学们更好地理解大脑是如何工作的比如Phineas Gauge是一名美国的铁路工人,在某次施工时遭遇爆炸事故,被一根铁棍击穿头颅,幸运的是他活了下来,但是他的左额叶皮质受到损伤,导致语言障碍,同时也影响其生理性格;还有Britten的论文描述大脑何时再混乱的移动点钟发现信号。所有这些零碎的研究开始加深我们大脑如何工作的理解。

1ae5c4a1fa23bc94494325dca04e3554f4915472

还有类似的一个例子,人类视觉和计算机视觉的大量研究奠定了基础,那就著名的HubelWiesel的研究。由于二人在心理学上的突出贡献,获得了1981年的诺贝尔和平奖,此外他们在视觉系统的信息处理方面也获得了突破性的发现他们打响了研究神经元的第一枪,他们通过连接一个电极一个神经元能够听神经元对一条光的刺激作出的反应他们V1大脑皮层神经元的工作原理有了新的了解这是令人兴奋的新认识,该研究有助于阐明V1神经元的映射相关功能。

在下面的视频中,演示了 V1神经元是如何对待位置和角度的光条做出反应的,当光移动就会有裂纹,这表明你听到猫的神经元对刺激做出的反应。

视频地址:http://v.youku.com/v_show/id_XNDc0MTg0NzA4.html?spm=5176.100239.blogcont241263.12.BcSa3L

通过这个实验,他们演示了几种类型的神经元只有在某些刺激下是如何被激活的,另一个有趣的特征是细胞似乎自然地映射到不同角度,如下图所示,V1的每一部分都包含一组非常特殊的神经元,这些神经元通常对特定角度的光条作出反应。

cc37b8a5640b890f34b819a9c19989f0b912538c

这些细胞反应以某种方式结合起来,理论上能够创建一个自向上的自然世界形象,也就是说,通过接收许多神经元各种光条的反应,人类大脑开始绘制出周围的图景

一晃近30过去了江山代有才人出,时代属于OlshausenDavid JField二位研究者两位研究人员都专注于计算神经科学领域个领域主要是研究大脑如何编码和解码信息,并推动了这个领域相关工作的进一步发展。事实上,他们在自己的工作中引用HubelWiesel的研究成果此外,他们不只注重单一的光条,还拍摄了照片,开始研究如何通过算法识别和编码图像内部的特征。

他们1996年(20多年前)写的一篇叫做自然图像统计和高效编码本文的目的是讨论在图像识别应用中失败的Hebbian学习模型。具体来说,Hebbian学习算法利用了主成分分析算法学习,但存在的问题是,模型不同时学习定位、定以及带通结构来绘制自然图像。从理论上讲,该模型部分源自于HubelWiesel关的研究成果,除此之外192个神经元的输出进行了建模

他们的研究表明,在对自然图像客观存在的规律进行编码时,模型的建立更多地侧重于稀疏性会使得模型更有效。

使用一个稀疏模型,该模型限制每个基函数列表所需的系数数目,来表示一个图像中的各种特征,由下式证明

2e955286cf99db4229c3a2b3e8a6af954291d5ea

其主体部分是为了找到实际图像和函数表示图像之间最低平均误差

7798040c74b9043f490f94e51328cc70ae76061c

然后与代价函数一起迫使算法限制表示图像表示所需的系数数量

b3e4716b7eaf66591578bafe3c4c6ad21d574606

使用梯度下降算法最大限度地减少表示图像所需的系数数量,但是该篇论文自身还没有显示出能够将特征转化为图像的神经网络。

1991年,互联网刚刚普及。现在科学已经从检测猫的神经元对光条刺激的反应转到神经网络的数学模型,该模型能够输出图像的实际特征。在1996年的那篇论文中,最后一行是未来一项重要令人兴奋的挑战将是如何将这些原理推理到更级的皮层视觉领域提供预测。这是一个挑战,通过利用低级的特,然后创建一个自下而上的网络模型来真正地预测一副图像

0a8cd9c39e5fcb359e77d2a7f8d89e982e69d20e

Olshausen等人的模型类似于上图,如果你对深度学习了解的话,那么对这个输出低级特征的矩阵看起来是不是非常熟悉

在过去的几年中,很多论文都使用了与上图非常相似的矩阵这些矩阵被用作卷积神经网络的卷积层。可以发现,这应该是模拟单个神经元对视觉刺激的反应方式。

942122a0eb72076660339626174de79833953cd5

此时此刻利用这些低层次的特征预测图像的实际背景不再是Olshausen等人论文中的最后一行中的理论猜想,这在今天变成了现实。

同时也说明了神经元能够识别光条的原因,神经网络可以利用低层次的特征预测图像所包含的信息2015斯坦福大学的Andrej Karpathy和李飞飞发表了一篇关于这一问题的重要论文——Deep Visual-Semantic Alignments for Generating Image Descriptions。在这篇论文中,演示了通过一个递归神经网络能够详细描述图像,如下图所示,仅仅只是指出了图片中有一只猫或一只狗,而且能够详细描述图像内容,比如男孩在尾板做后空翻虽然现在它并不完美,但它相较于1968年而言,仍是一个跨越式的发展!

89613207630f6e7891ac99a223ef7c962ddbd114

1968年到现在,这是一个漫长的发展过程。本文引用的论文1968开始到2015结束都快有50年的时间。然而,从大局来看,神经网络的发展越来越快,它不仅仅只是用来识别图像,还被用于医学图像的癌症检测预测人类的情感表达自动驾驶等等各个领域

接下来的50年里,计算机视觉的发展前景如何?欢迎广大读者留言发表自己的看法。

作者信息

SeattleDataGuy软件工程师,专注于机器学习、深度学习以及数据科学

Twitterhttps://twitter.com/SeattleDataGuy

本文由北邮@爱可可-爱生活老师推荐,阿里云云栖社区组织翻译。

文章原标题《From Neuroscience To Computer Vision》,作者: SeattleDataGuy,译者:海棠,审阅:李烽

文章为简译,更为详细的内容,请查看原文

 

相关文章
|
5月前
|
机器学习/深度学习 传感器 编解码
探索深度学习在图像识别中的应用进展
【5月更文挑战第29天】 随着人工智能领域的迅猛发展,深度学习技术已成为推动图像识别前进的核心动力。本文旨在探讨深度学习在图像识别领域内的应用进展,并分析其对相关行业的影响。文中首先概述了深度学习的基本原理和关键技术,随后详细阐述了卷积神经网络(CNN)在图像分类、目标检测及语义分割中的创新应用。通过精选案例,展示了深度学习如何提升图像处理的准确性与效率。最后,文章讨论了目前面临的挑战及未来发展趋势,为该领域的研究者和实践者提供参考。
|
2月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
深度学习在图像识别中的应用与挑战
【8月更文挑战第27天】本文将深入探讨深度学习技术在图像识别领域的应用及其面临的挑战。我们将通过一个简单的代码示例,展示如何使用深度学习模型进行图像分类。文章将分析当前深度学习技术的发展趋势和未来可能的研究方向。
|
2月前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习在图像识别中的应用与挑战深度学习在图像识别中的应用与挑战
【8月更文挑战第30天】本文深入探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过具体案例,揭示了深度学习如何革新图像处理和分析的方式,同时指出了数据偏差、模型泛化能力等关键问题,为未来研究提供了方向。
|
3月前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的应用及挑战
随着人工智能技术的不断进步,深度学习已成为推动图像识别领域发展的核心动力。本文将深入分析深度学习在图像识别中的应用,包括其技术原理、成功案例以及面临的主要挑战。通过具体数据和案例的支撑,本文旨在提供一个全面且深入的视角,帮助读者理解深度学习如何革新了图像识别领域,并探讨未来的发展方向。
34 0
|
5月前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的应用进展
【5月更文挑战第30天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域前进的核心动力。尤其在图像识别任务中,深度学习模型展现出了卓越的性能,不仅大幅提高了识别精度,还拓展了应用场景的广度。本文旨在探讨近年来深度学习技术在图像识别领域的创新应用,分析其技术演进脉络,并对未来发展趋势进行展望。通过综述卷积神经网络(CNN)的优化策略、数据增强技巧以及迁移学习的实践案例,揭示深度学习如何有效解决图像识别中的挑战问题,并对几个关键领域如自动驾驶、医疗影像分析和安防监控中的实际应用进行深入剖析。
|
5月前
|
机器学习/深度学习 边缘计算 计算机视觉
基于深度学习的图像识别优化技术研究
【5月更文挑战第5天】 在当前的计算机视觉领域,图像识别技术已取得显著进展,尤其是深度学习方法的广泛应用。然而,随着数据量的日益增加和模型复杂度的提升,如何提高图像识别的效率与准确性成为新的挑战。本文提出了一种基于改进卷积神经网络(CNN)的图像识别优化技术,旨在减少模型参数量、加速推理过程,并保持甚至提升识别精度。通过引入深度可分离卷积、注意力机制以及量化剪枝策略,该技术在多个标准数据集上显示出了卓越的性能。
|
5月前
|
机器学习/深度学习 算法 安全
基于深度学习的图像识别技术进展
【5月更文挑战第28天】 在当今信息爆炸的时代,图像数据的自动解读和处理成为了计算机视觉领域的核心课题。本文综述了基于深度学习的图像识别技术的最新进展,包括卷积神经网络(CNN)的变体、目标检测算法、图像分割方法以及无监督学习策略。我们着重分析了这些技术如何提高模型的泛化能力,减少对标注数据的依赖,并在特定应用场景中实现超越人类的识别精度。此外,还探讨了当前技术面临的主要挑战,如对抗性攻击、数据偏见和计算资源需求等。
|
5月前
|
机器学习/深度学习 自动驾驶 算法
探索基于深度学习的图像识别在自动驾驶中的应用
【5月更文挑战第20天】 在自动驾驶技术的迅猛发展过程中,图像识别技术作为其核心组成部分之一,正逐渐从传统的算法转向更加高效和智能的深度学习方法。本文将详细探讨深度学习在图像识别领域的最新进展及其在自动驾驶系统中的具体应用。首先,文章概述了深度学习的基础理论和关键技术,然后通过案例分析展示了这些技术如何提升自动驾驶车辆对环境的感知能力。最后,讨论了当前面临的挑战和未来的发展方向,为该领域的研究者和工程师提供了宝贵的参考。
|
5月前
|
机器学习/深度学习 边缘计算 人工智能
深度学习在图像识别领域的应用进展
【4月更文挑战第4天】 随着人工智能技术的迅猛发展,深度学习已成为推动计算机视觉特别是图像识别技术革新的核心力量。本文聚焦于深度学习在图像识别领域的应用进展,从基础理论到实践应用,系统地梳理了卷积神经网络(CNN)的演进、优化策略以及面临的挑战和解决方案。通过对最新研究成果的综述,本文旨在为读者提供一个清晰的技术蓝图,揭示深度学习如何不断突破限制,提升图像识别的准确性与效率。
|
5月前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用研究
【4月更文挑战第20天】 本研究聚焦于深度学习技术在图像识别领域的应用,并探讨其在自动驾驶系统中的实际效用。文章首先回顾了深度学习与图像处理技术的基础知识,随后详细分析了卷积神经网络(CNN)在车辆环境感知中的关键作用。通过实验数据对比分析,本文验证了所提出算法在提高自动驾驶车辆对周围环境的识别准确性和实时性方面的有效性。最后,讨论了目前技术的局限性及未来可能的研究方向,旨在为进一步的技术突破提供参考。