计算机视觉介绍

简介: 【7月更文挑战第29天】计算机视觉介绍。

计算机视觉是一个跨学科的领域,涉及的部分学科如图计算机视觉涉及的部分学科
在20世纪60年代后期,一些涉及了人工智能相关方向的大学开始研究计算机视觉,它旨在模仿人类的视觉系统,开始的时候,开发者希望利用计算机视觉从图像中提取三维结构,以实现对整个场景的理解。20世纪70年代的研究包括从图像中提取边缘、标记线条、进行非多面体和多面体建模、将对象表示为较小结构的互连、光流以及运动估计等,为当今的计算机视觉奠定了基础。
计算机视觉是深度学习最先取得突破性成就的领域。2012年,在ILSVRC大赛上,基于卷积神经网络的AlexNet模型获得了当年图像分类的冠军。历年ILSVRC比赛冠军模型错误率如图8-2所示。从下图中可以看出,在2012年以前,传统的视觉处理方法错误率最低的为2011年的25.80%。在2012年,将深度学习引入计算机视觉后,错误率降到了16.40%。从2013年开始,比赛中的前20名都使用了深度学习算法。2013年之后,ILSVRC比赛就基本上只有深度学习算法参赛了。2012—2016年,通过对算法的研究以及优化,识别错误率在不断地下降,这让图像分类问题得到了很好的解决。在2015年,当年的冠军模型ResNet将错误率下降到了3.60%,要低于人工标注的错误率5.1%,实现了计算机视觉上的突破。

历年ILSVRC比赛冠军模型错误率
神经网络和深度学习极大地推动了计算机视觉的发展,发展较好的几个方向如下。
1.图像分类
在图像分类问题中,图像上只有单一类别,将很多带有标记的数据集进行训练之后,可以对新的、未知的、具有单一类别的图像进行预测,类似于教小孩子看图识物,这种方法是数据驱动的方法,也是图像分类最常用的方法。例如,对猫的类别进行训练后,再将下图所示的照片输入网络进行预测,在网络训练效果不错的前提下,可以识别出这是一只猫。

猫的照片
2.目标检测
与图像分类不同,进行目标检测的图像中并不一定只有单一类别的物体。在处理这类问题时,需要在数据上针对各个对象画出边界框和标签,训练完成后可以对新的图像进行预测,目标检测如图所示,方框可以圈出猫的位置。

目标检测
3.语义分割
语义分割与目标检测不同,语义分割需要对每个像素进行语义上的理解,由于需要对每个像素属于图像上的哪个部分做出分类,所以每个像素都拥有标签,语义分割如图所示。

语义分割
计算机视觉比较突出的应用领域如下。医学图像检验:从图像数据中提取信息以诊断患者患病类别;工业领域:在该领域,计算机视觉有时被称为机器视觉,如产品质量把控,机器视觉也大量运用于农业上,以去除不良幼苗或除虫;安防、娱乐领域:传统机器学习的方法运用于人脸识别时并不能很好地满足精度要求,并且同一个人在不同光照、姿态下的特征会有差异,在深度学习运用于计算机视觉后,算法能够提升识别准确率;光学字符识别:将计算机无法理解的图

相关文章
|
机器学习/深度学习 自然语言处理 算法
深度学习算法概念介绍
深度学习算法概念介绍
|
机器学习/深度学习 人工智能 机器人
计算机视觉技术介绍
【10月更文挑战第14天】 计算机视觉技术介绍
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理(NLP)是AI的重要分支,旨在让计算机理解人类语言
自然语言处理(NLP)是AI的重要分支,旨在让计算机理解人类语言。本文探讨了深度学习在NLP中的应用,包括其基本任务、优势、常见模型及具体案例,如文本分类、情感分析等,并讨论了Python的相关工具和库,以及面临的挑战和未来趋势。
941 1
|
机器学习/深度学习 人工智能 自然语言处理
什么是深度学习
【10月更文挑战第23天】什么是深度学习
|
机器学习/深度学习 人工智能 自然语言处理
探索深度学习与自然语言处理的最新进展
探索深度学习与自然语言处理的最新进展
394 0
|
机器学习/深度学习 存储 人工智能
人工智能的三大主义
人工智能的三大主义之一——符号主义,通过数学和逻辑符号构建表达式以模拟人类思维。其代表性成果包括1956年的“逻辑理论家”程序和上世纪80年代的专家系统。1997年,“深蓝”计算机击败国际象棋冠军卡斯帕罗夫,是符号主义在博弈领域的巅峰之作。然而,由于人类智能的复杂性和广泛性,符号主义难以完全模拟人类感知和潜智能,逐渐走向衰落。
|
自然语言处理 监控 机器人
自然语言处理中的语义理解和生成技术
【8月更文第18天】自然语言处理(NLP)是计算机科学的一个重要分支,其目标是使计算机能够理解、解析和生成人类语言。近年来,基于Transformer架构的预训练模型(如BERT、GPT系列)已经极大地推动了NLP的发展。本文将探讨这些模型在对话系统、文本生成、情感分析等领域的应用,并讨论相关技术挑战。
884 1
|
机器学习/深度学习 人工智能 自然语言处理
详谈什么是自然语言处理(NLP),特点以及使用场景场景(一)
详谈什么是自然语言处理(NLP),特点以及使用场景场景(一)
627 0
|
机器学习/深度学习 算法 数据可视化
机器学习的核心功能:分类、回归、聚类与降维
机器学习领域的基本功能类型通常按照学习模式、预测目标和算法适用性来分类。这些类型包括监督学习、无监督学习、半监督学习和强化学习。
1280 0
|
机器学习/深度学习 人工智能 自然语言处理
机器学习、深度学习和强化学习的关系和区别是什么?
众所周知,人工智能领域知识庞大且复杂,各种专业名词层出不穷,常常让初学者看得摸不着头脑。比如“机器学习”、“深度学习”、“强化学习”就属于这类名词。那么,针对这三者各自具体有哪些内容?三者是否有相关性?不同核心及侧重点是什么?以及各自的应用领域有哪些?应用的前景如何?等问题,本文根据百度百科等相关资料里的内容进行整理,形成了以下详细的阐述。
3540 0