计算机视觉应用总纲

简介: 计算机视觉应用总纲

前言


      计算机视觉可以分为以下几大方向:图像分类、目标检测、图像分割、风格迁移、图像重构、超分辨率、图像生成、人脸、其他。

b001cd2dd849a60e17405f7ed5f145b8.jpeg1、图像分类


       ★ 图像分类是计算机视觉领域的重要研究内容之一,在许多领域得到了广泛的应用,如:遥感图像的分析、安防领域的人脸识别和智能视频分、交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识、机器人领域的图像识别等。


       ★ 图像分类包括通用图像分类、细粒度图像分类等。左图展示了通用图像分类效果,即模型可以正确识别图像上的主要物体。右图展示了细粒度图像分类-花卉识别的效果,要求模型可以正确识别花的类别


1dc618a0ed9580ce8bfa6facb208c08f.png


2、目标检测


       ★ 目标检测的目标是在给定一张图像或是一个视频帧的条件下,让计算机找出其包含的所有目标,并标出它们处在图像中的具体位置。这意味着,计算机不仅要用算法来判断出图像中哪个物体是汽车、 自行车或者狗,还要在图像中标记出它们的坐标位置, 用边框或红色方框把它们圈起来, 这就是目标检测问题。如下图所示。


5d4c6812c8535adbb050f4ddf2e1bce8.png


3 、图像分割


       ★ 图像分割的应用非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。例如,在卫星遥感图像识别中,合成孔径雷达图像中目标的分割。在医学图像诊断应用中,脑部MR图像分割脑组织和其他组织区域。在交通车牌信息识别中,把车辆目标从背景中分割出来。


       ★ 那么什么是图像分割呢?所谓图像分割是指通过特征把图像划分成多个区域,同区域的特征一致或相似,不同区域的特则征截然不同。具体效果像如下图


46a9d80a6e05e4e3b19d57a0ee70bcdf.png


       ★ 按照具体分割效果的不同,图像分割分为语义分割、实例分割和全景分割。语义分割:是对图像中每个像素都划分出对应的类别,即实现图像在像素级别上的分类。在开始图像分割处理之前,必须明确语义分割的任务要求,理解语义分割的输入与输出。近年来多应用在无人车驾驶技术、医疗影像分析中辅助诊断等。


(特殊)全景分割

       ★ 在实例分割的基础之上,还需对图中所有物体包括背景都要进行检测和分割,使用不同颜色区分不同实例。全景分割任务要求识别图像中的每个像素点,并且必须给出语义标签和实例编号。其中的语义标签是物体的类别,而实例编号对应的是同类但不同实例的标识。如下图分别展示了(a)原始图像,(b)语义分割,(c)实例分割,(d)全景分割。


66ba272a0bfc97be54a5fa679e3d5482.png


4、风格迁移


       ★ 风格迁移是指将一个领域或者几张图片的风格应用到其他领域或者图片上。比如将抽象派的风格应用到写实派的图片上。


       ★ 一个风格迁移的例子如下, 图 A 是原图,后面的 B-D 三幅图都是根据不同风格得到的结果。


88b9988b40447cb37c7e3c492d49867f.png


5、图像重构


       ★ 图像重构,也称为图像修复(Image Inpainting),其目的就是修复图像中缺失的地方,比如可以用于修复一些老的有损坏的黑白照片和影片。通常会采用常用的数据集,然后人为制造图片中需要修复的地方。


       ★ 一个修复的例子如下所示,总共是四张需要修复的图片,例子来自论文"Image Inpainting for Irregular Holes Using Partial Convolutions"。


80308c27701d3aead18db6c7b167f308.png


6、超分辨率


超分辨率是指生成一个比原图分辨率更高、细节更清晰的任务。一个例子如下图所示:


1014213c4196c8798c8417b952a8a253.png


      6 ★通常超分辨率的模型也可以用于解决图像恢复(image restoration)和修复(inpainting),因为它们都是解决比较关联的问题。


      6 ★常用的数据集主要是采用现有的数据集,并生成分辨率较低的图片用于模型的训练。


7、图像生成


      7 ★ 图像生成是根据一张图片生成修改部分区域的图片或者是全新的图片的任务。这个应用最近几年快速发展,主要原因也是由于 GANs 是最近几年非常热门的研究方向,而图像生成就是 GANs 的一大应用。(styleGan2)


       7 ★ 一个图像生成例子如下:


20190416165655169.png


8、其他领域的应用


       8 ★ 实际上还有其他很多方向,包括:


       8 ★ 人脸识别、步态识别等身份识别:通过人体不同的独有特征识别个体身份。


       8 ★ 图文生成(Image Captioning):给图片生成一段描述。


       8 ★ 文本生成图片(Text to Image):基于文本来生成图片。


       8 ★ 图片上色(Image Colorization):将图片从黑白变为彩色图。


       8 ★ 人体姿态估计(human pose estimation):识别人的行为动作。


相关文章
|
8月前
|
存储 编解码 算法
OpenCV2 计算机视觉应用编程秘籍:6~10
OpenCV2 计算机视觉应用编程秘籍:6~10
88 0
|
8月前
|
机器学习/深度学习 人工智能 算法
图像处理与分析:Python中的计算机视觉应用
【4月更文挑战第12天】Python在计算机视觉领域广泛应用,得益于其丰富的库(如OpenCV、Pillow、Scikit-image)和跨平台特性。图像处理基本流程包括获取、预处理、特征提取、分类识别及重建生成。示例代码展示了面部和物体检测,以及使用GAN进行图像生成。
133 2
|
2月前
|
机器学习/深度学习 数据采集 算法
隧道裂纹识别:基于计算机视觉与机器学习的应用分享
隧道裂纹的自动检测通过深度学习与计算机视觉技术实现,替代了传统人工检查,提高了检测精度与效率。本文介绍了一套完整的裂纹检测流程,包括图像采集、预处理、裂纹检测与标定、后处理及结果展示,提供了图像处理与深度学习模型的基本代码框架,旨在帮助读者掌握隧道裂纹检测的实际应用方法。
|
3月前
|
机器学习/深度学习 算法 PyTorch
【机器学习】大模型环境下的应用:计算机视觉的探索与实践
【机器学习】大模型环境下的应用:计算机视觉的探索与实践
95 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习与计算机视觉的结合:技术趋势与应用
深度学习与计算机视觉的结合:技术趋势与应用
252 9
|
5月前
|
传感器 自动驾驶 安全
计算机视觉在自动驾驶中的应用:技术解析与未来展望
【8月更文挑战第4天】自动驾驶依托计算机视觉实现环境感知与决策,通过目标检测、跟踪及车道识别等技术保障行车安全与效率。面对数据处理、场景理解等挑战,未来技术将持续优化,深化智能驾驶体验,引领交通行业变革。
|
6月前
|
自然语言处理 监控 自动驾驶
大模型在自然语言处理(NLP)、计算机视觉(CV)和多模态模型等领域应用最广
【7月更文挑战第26天】大模型在自然语言处理(NLP)、计算机视觉(CV)和多模态模型等领域应用最广
302 11
|
6月前
|
机器学习/深度学习 人工智能 监控
计算机视觉技术在安防领域的应用深度解析
【7月更文挑战第28天】计算机视觉技术作为人工智能领域的重要分支,在安防领域的应用前景广阔。通过不断提升技术性能和解决实际应用中的问题,计算机视觉技术将进一步提升安防工作的效率和准确性,为公共安全和社会稳定贡献更大的力量。
|
6月前
|
机器学习/深度学习 传感器 人工智能
高效能计算机视觉技术在工业自动化中的应用与发展
随着工业自动化的迅速发展,高效能计算机视觉技术正成为关键驱动力。本文探讨了计算机视觉在工业自动化中的重要性,以及其应用和未来发展趋势。通过深入分析现有技术和案例研究,展示了计算机视觉如何提升生产效率、质量控制和安全性,并展望了其在智能制造中的潜力。 【7月更文挑战第13天】
96 1
|
6月前
|
机器学习/深度学习 人工智能 固态存储
深度学习在计算机视觉中的应用:重塑视觉感知的未来
【7月更文挑战第1天】深度学习重塑计算机视觉未来:本文探讨了深度学习如何革新CV领域,核心涉及CNN、RNN和自注意力机制。应用包括目标检测(YOLO、SSD等)、图像分类(VGG、ResNet等)、人脸识别及医学影像分析。未来趋势包括多模态融合、语义理解、强化学习和模型可解释性,推动CV向更高智能和可靠性发展。

热门文章

最新文章