计算机视觉介绍

简介: 【7月更文挑战第29天】计算机视觉介绍。

计算机视觉是一个跨学科的领域,涉及的部分学科如图计算机视觉涉及的部分学科
在20世纪60年代后期,一些涉及了人工智能相关方向的大学开始研究计算机视觉,它旨在模仿人类的视觉系统,开始的时候,开发者希望利用计算机视觉从图像中提取三维结构,以实现对整个场景的理解。20世纪70年代的研究包括从图像中提取边缘、标记线条、进行非多面体和多面体建模、将对象表示为较小结构的互连、光流以及运动估计等,为当今的计算机视觉奠定了基础。
计算机视觉是深度学习最先取得突破性成就的领域。2012年,在ILSVRC大赛上,基于卷积神经网络的AlexNet模型获得了当年图像分类的冠军。历年ILSVRC比赛冠军模型错误率如图8-2所示。从下图中可以看出,在2012年以前,传统的视觉处理方法错误率最低的为2011年的25.80%。在2012年,将深度学习引入计算机视觉后,错误率降到了16.40%。从2013年开始,比赛中的前20名都使用了深度学习算法。2013年之后,ILSVRC比赛就基本上只有深度学习算法参赛了。2012—2016年,通过对算法的研究以及优化,识别错误率在不断地下降,这让图像分类问题得到了很好的解决。在2015年,当年的冠军模型ResNet将错误率下降到了3.60%,要低于人工标注的错误率5.1%,实现了计算机视觉上的突破。

历年ILSVRC比赛冠军模型错误率
神经网络和深度学习极大地推动了计算机视觉的发展,发展较好的几个方向如下。
1.图像分类
在图像分类问题中,图像上只有单一类别,将很多带有标记的数据集进行训练之后,可以对新的、未知的、具有单一类别的图像进行预测,类似于教小孩子看图识物,这种方法是数据驱动的方法,也是图像分类最常用的方法。例如,对猫的类别进行训练后,再将下图所示的照片输入网络进行预测,在网络训练效果不错的前提下,可以识别出这是一只猫。

猫的照片
2.目标检测
与图像分类不同,进行目标检测的图像中并不一定只有单一类别的物体。在处理这类问题时,需要在数据上针对各个对象画出边界框和标签,训练完成后可以对新的图像进行预测,目标检测如图所示,方框可以圈出猫的位置。

目标检测
3.语义分割
语义分割与目标检测不同,语义分割需要对每个像素进行语义上的理解,由于需要对每个像素属于图像上的哪个部分做出分类,所以每个像素都拥有标签,语义分割如图所示。

语义分割
计算机视觉比较突出的应用领域如下。医学图像检验:从图像数据中提取信息以诊断患者患病类别;工业领域:在该领域,计算机视觉有时被称为机器视觉,如产品质量把控,机器视觉也大量运用于农业上,以去除不良幼苗或除虫;安防、娱乐领域:传统机器学习的方法运用于人脸识别时并不能很好地满足精度要求,并且同一个人在不同光照、姿态下的特征会有差异,在深度学习运用于计算机视觉后,算法能够提升识别准确率;光学字符识别:将计算机无法理解的图

相关文章
|
4月前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习的魔法:打造你自己的图像识别器
【9月更文挑战第23天】本文将带你开启一场深度学习的奇幻之旅,从零开始构建一个能够识别图像的智能模型。我们将一起揭开深度学习神秘的面纱,用简单的语言和直观的例子探索其背后的原理。你不需要任何先验知识,只需跟随我们的步伐,一步步实现你的图像识别梦想。在这个过程中,你将学会如何训练模型、测试它的性能,并了解如何改进它。让我们开始吧,创造属于你的智能图像识别器!
|
26天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用
本文将探讨深度学习技术在图像识别领域的应用。我们将介绍深度学习的基本原理,以及如何利用这些原理进行图像识别。我们将通过一个简单的代码示例来演示如何使用深度学习模型进行图像分类。最后,我们将讨论深度学习在图像识别领域的未来发展趋势和挑战。
|
6月前
|
机器学习/深度学习 人工智能 自动驾驶
探索深度学习在图像识别中的应用
【7月更文挑战第27天】随着人工智能技术的不断进步,深度学习已经成为解决图像识别问题的重要工具。本文将深入探讨深度学习技术如何革新图像识别领域,包括其基本原理、关键技术、以及在不同场景下的应用实例。通过分析深度学习模型如卷积神经网络(CNN)在图像处理中的优势,我们旨在揭示这一技术如何提高图像识别的准确性和效率,同时讨论当前面临的挑战和未来的发展方向。
54 1
|
4月前
|
机器学习/深度学习 算法 vr&ar
深度学习在图像识别中的新突破
本文探讨了深度学习技术在图像识别领域的最新进展,特别是卷积神经网络(CNN)的应用。通过对现有技术的深入分析和实验数据,展示了深度学习如何提升图像识别的准确性和效率。
|
8月前
|
机器学习/深度学习 算法 计算机视觉
揭秘深度学习在图像识别中的应用
【4月更文挑战第27天】随着人工智能技术的飞速发展,深度学习已经成为了计算机视觉领域的核心驱动力。本文将深入探讨深度学习在图像识别任务中的应用,包括卷积神经网络(CNN)的基本概念、关键技术以及优化策略。通过对比传统机器学习方法,我们将揭示深度学习如何提高图像识别的准确性和效率。
49 2
|
8月前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的应用与实现
深度学习在图像识别中的应用与实现
50 0
|
8月前
|
机器学习/深度学习 数据采集 算法
深度学习在图像识别方面的应用
【4月更文挑战第8天】
81 3
|
6月前
|
数据采集 算法 数据可视化
阿里云百炼开发者评测
阿里云百炼是一站式大模型开发平台,具有以下特点: 知识检索应用:搭建智能问答助手需经历数据准备、知识库建立、应用创建与配置、测试与优化四步,存在数据质量、索引构建、问答效果调优等困难,建议加强数据预处理、优化索引构建机制并加强产品支持和社区建设。 模型训练:通过数据准备、调优等操作提升模型问答效果,控制台操作指引清晰,但可增加更多行业模板并优化模型训练界面。 流程管理功能:通过自定义业务流程对接智能体应用满足场景需求,使用效果较好,但存在部分参数设置不明确的问题,建议预制系统模板方便用户学习。整体上,百炼功能全面,但在细节和用户体验方面有待改进。
150 1
|
前端开发 Android开发 iOS开发
Notifee使用-React Native发送通知
Notifee使用-React Native发送通知
389 0
|
6月前
|
机器学习/深度学习 存储 TensorFlow
项目介绍
【7月更文挑战第29天】项目介绍。
50 3