AI遮天传 DL-深度学习在计算机视觉中的应用

简介: AI遮天传 DL-深度学习在计算机视觉中的应用

一、图像分类

a. 通用图像分类

将不同图片按照内容进行分类

b. 特定图像分类

特定识别人脸、某种动物、汽车等

1.1 人脸验证

 

下面是两种典型的人脸识别损失函数

1.1.1 DeepID2

上图左侧两个人比较像,都是侧脸,所以箭头短一点,下方一个是侧脸一个是正脸,而且光照也不相同,所以箭头长一点。我们希望经过训练后,上方的两张图片离得远一点(因为这是两个不同的人),而下方的图片近一些(同一个人)。

目标:当i,j身份相同时, 足够小,否则  其中

损失:

(一个minibatch至 少包含2个样本,为标签。)

1.1.2 FaceNet

随计算一个人得图片做为Anchor,然后选择和他同一个人的图片和不同的人的图片做训练。 其它同上。

目标:  其中 a>0

损失:

(一个minibatch至 少包含3个样本)

1.1.3 人脸验证的其它损失函数

SphereFace: Deep Hypersphere Embedding for Face Recognition, CVPR 2017

NormFace: L2 Hypersphere Embedding for Face Verification, ACM MM 2017

ArcFace: Additive Angular Margin Loss for Deep Face Recognition, CVPR 2019

二、物体检测

任务:找出图片中的物体和每个物体所在的位置。

怎么做这个任务?

找到包含物体的区域,用一个多分类器进行物体分类

怎么知道哪些区域包含物体?

找到很多候选区域,用一个二分类器进行区域分。

2.1 候选区域(Region Proposals)

指可能包含物体的区域、感兴趣区域 (Region of interest, ROI)。

挑选候选区域的多种选择

2.1.1 (C+1)-类的分类

上面提到简单检测物体的思路:


找到很多候选区域,用一个二分类器进行区域分类。

找到包含物体的区域,用一个多分类器(Softmax、SVM等)进行物体分类。

另外一种方法:


设有C个类别,加一个“背景”类

对每个区域用一个多分类器进行(C+1)-类的分类

对每个区域用(C+1)个二分类器进行分类

2.1.2 R-CNN

把每个候选框的图片剪贴出来,变成相同尺寸,经过一个同样的CNN进行一个二分类。这里用的上面提到的C+1类方法。SVM解决二分类问题。至于Bbox reg 用于解决回归问题,坐标定位。


步骤:


训练(或下载)ImageNet分类模型(如AlexNet)

针对检测微调(fine-tune)

提取特征

每个类别训练一个二分类SVM来为候选区域的特征进行分类

对每个类别,训练一个线性回归模型,将特征映射到一组偏移量,用以校正那些稍微有些误 差的候选区域

R-CNN有什么问题吗?


测试慢


需要对每个ROI跑一个完整的CNN前向过程。

非“端到端”过程


找候选区域, SVM和回归器基于CNN的特征进行处理。

SVM和回归器不能更新CNN的特征。

更好的想法?


先在整张图上跑一个CNN的前向过程,然后将每个ROI映射到特征图上。

2.1.3 Fast R-CNN

即先把整张图做一个神经网络,先把特征取好,想要什么特征就取什么特征。

感兴趣区域池化(RoI Pooling)

可见上面提取的图片大小是不同的,这里做一下池化。

结果:

Fast R-CNN问题:

R-CNN和Fast R-CNN它们的那些“框”来自于计算机视觉上的一些方法,万一不准怎么办?

2.1.4 Faster R-CNN

在最后一个卷积层后插入候选区域网络(Region Proposal Network ,RPN)

RPN用来直接产生候选区域; 不需要额外的候选框。

RPN之后, 使用RoI Pooling以及分类 器、回归器,类似Fast R-CNN。

通过Fast R-CNN的一个神经网络得到feature map,在最后一个卷积层后插入了RPN,会输出一些ROI。用神经网络的特征预测哪些区域有误。前面的方法用其它方法预测候选区域不一定准,而且是在Deep Learing兴起之前的一些方法。

候选区域网络 (RPN)

在feature map每个点上做两个预测,在每个点提出k个框(不同大小形状,k常设置为9,3种不同的形状*3种不同的大小如上右图),把这些框经过一个全连接层得到一个256维的向量去做两个任务1.识别物体(2分类,2k个) 2. 定位(4k个)。

Faster R-CNN 结果

2.1.5 两阶段与单阶段

上面介绍的三个模型有一个共同点,需要一些候选框,再对每个候选框进行处理。我们把这一类的方法称之为:两阶段方法。

两阶段方法较慢,现在人们已经在研发更快的方法:单阶段模型,它不再去预测哪个框是更合适的,所以更快,但精度会有些问题。

单阶段如何实现呢?

2.1.6 YOLO: You only look at once

将图像划分为S×S个网格;

每个网格预测B个矩形框, 每个框的置信度(与任意一个Ground truth框的IOU), 以及C个类别的概率。

这些预测结果可整合为大小为 S ×S ×(B ∗5 + C) 的张量

效果对比

https://github.com/yehengchen/Object-Detection-and-Tracking/blob/master/Twostage%20vs%20One-stage%20Detectors.md

在日常生活中,特定的物体检测应用更加广泛一些

三、图像分割

给定一张图片,对每个像素进行分类。

通常的一些卷积方法会使输出变小,所以我们就需要一些方法来增他特征图。

如何增大特征图?

上采样 (采样和插值)

对于一张输入图片,将其放大到指定尺寸,并用插值方法计算每个像素的值,例如双线性插值。

转置卷积 (不应称为反卷积deconvolution)

http://deeplearning.net/software/theano/tutorial/conv_arithmetic.html

3.1 全卷积网络(Fully Convolutional Networks)

一种典型图片分割网络。

对于一个输入,经过一些卷积后图片变得很小,进行上采样(此时尺寸和刚输入时相同)。

四、图像风格转换

主要的应用为图像分类、物体检测、图像分割,至于图像风格转换比较有趣,因此也分享一下。

相关文章
|
22小时前
|
机器学习/深度学习 人工智能 算法
介绍一下AI在药物研发中的应用。
【10月更文挑战第16天】介绍一下AI在药物研发中的应用。
7 0
|
2天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用探索###
随着信息技术的飞速发展,传统的IT运维模式正面临着前所未有的挑战。本文旨在探讨人工智能(AI)技术如何赋能IT运维,通过智能化手段提升运维效率、降低故障率,并为企业带来更加稳定高效的服务体验。我们将从AI运维的概念入手,深入分析其在故障预测、异常检测、自动化处理等方面的应用实践,以及面临的挑战与未来发展趋势。 ###
|
2天前
|
机器学习/深度学习 算法 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第14天】 本文将深入探讨深度学习在图像识别领域的应用,包括其基本原理、主要算法、以及面临的挑战。我们将从基础的卷积神经网络(CNN)开始,逐步深入了解更复杂的网络结构,如ResNet和DenseNet。同时,我们也将讨论当前深度学习在图像识别中面临的一些主要挑战,包括数据不平衡、过拟合等问题,并探讨可能的解决方案。
|
2天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗领域的革命性应用
【10月更文挑战第14天】 本文探讨了人工智能(AI)在医疗行业中的多种应用,包括疾病诊断、个性化治疗、药物研发等。通过具体案例分析,展示了AI技术如何提高医疗服务效率和准确性,同时指出了当前面临的挑战与未来发展趋势。
15 2
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的创新应用与实践###
本文旨在探讨人工智能(AI)技术如何革新软件测试领域,提升测试效率、质量与覆盖范围。通过深入分析AI驱动的自动化测试工具、智能化缺陷预测模型及持续集成/持续部署(CI/CD)流程优化等关键方面,本研究揭示了AI技术在解决传统软件测试痛点中的潜力与价值。文章首先概述了软件测试的重要性和当前面临的挑战,随后详细介绍了AI技术在测试用例生成、执行、结果分析及维护中的应用实例,并展望了未来AI与软件测试深度融合的趋势,强调了技术伦理与质量控制的重要性。本文为软件开发与测试团队提供了关于如何有效利用AI技术提升测试效能的实践指南。 ###
|
4天前
|
机器学习/深度学习 人工智能 监控
探索AI技术在医疗健康领域的应用与挑战
【10月更文挑战第13天】 本文探讨了人工智能(AI)在医疗健康领域的多种创新应用,包括疾病诊断、个性化治疗、患者监护和药物研发等方面。同时,文章也分析了当前AI技术在实际应用中面临的挑战,如数据隐私、算法透明度、监管问题等,并提出了一些可能的解决思路。通过综合分析,本文旨在为读者提供一个关于AI在医疗领域应用现状及未来的全面视角。
22 3
|
1天前
|
机器学习/深度学习 数据采集 人工智能
深度学习在图像识别中的应用与挑战
【10月更文挑战第15天】 本文探讨了深度学习在图像识别领域的应用及其面临的挑战。随着人工智能技术的发展,深度学习已经成为图像识别的重要工具,广泛应用于医疗、安防、自动驾驶等多个领域。然而,深度学习模型在实际应用中仍面临数据质量、计算资源和模型解释性等问题。本文将详细分析这些问题,并探讨可能的解决方案。
7 0
|
2天前
|
机器学习/深度学习 监控 算法
深度学习在图像识别中的创新应用与未来趋势###
【10月更文挑战第14天】 本文探讨了深度学习技术在图像识别领域的创新突破,强调其在提升识别精度、效率及拓展应用场景上的关键作用。通过对比传统方法,凸显了深度学习模型的优越性,并展望其未来发展趋势,包括模型优化、跨模态学习及隐私保护等方向。 ###
13 0
|
9天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用与发展
本文将深入探讨深度学习技术在图像识别领域的应用,通过案例分析展示其最新进展。我们将从基本原理出发,了解深度学习如何改变图像处理和识别的方式,并展望其未来可能的发展方向。
|
9天前
|
机器学习/深度学习 自动驾驶 安全
深度学习在图像识别中的应用与挑战
随着科技的不断进步,深度学习技术已经成为解决许多复杂问题的利器,尤其在图像识别领域。本文将探讨深度学习在图像识别中的应用及其所面临的挑战,并分析未来可能的发展方向。

热门文章

最新文章