【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)

简介: 【计算机视觉+自动驾驶】二、多任务深度学习网络并联式、级联式构建详细讲解(图像解释 超详细必看)

觉得有帮助麻烦点赞关注收藏~~~

一、多任务网络的主要分类

目前建立的多任务网络可以分为两种方法,一种为并联多任务网络结构,另一种为级联多任务网络结构,两种网络构建方式分别如下图所示

并联式

级联式

并联网络结构大多为共享基础网络而保留所有与任务相关的卷积层网络,这种方法可以实现任意两种或者多种相关任务之间的多任务网络构建,不需要考虑任务之间的结构关系,较为简单

级联网络结构为通过一个任务结果来影响下一个任务结果,此种方法需要考虑两种任务之间的转化关系,但该方法可以使任务之间共享更多的网络参数,还可以使各个任务相辅相成,提高各自任务的准确率

二、并行式网络

并联式多任务联合算法的检测任务和分割任务共享卷积特征,每个任务包含一个损失函数,多任务联合算法的整体损失函数定义为检测损失函数和分割损失函数的总和,在反向传播的梯度合并过程中,不同任务的损失所占权重都是平等的。

并联式网络损失函数的设计

并联式多任务联合算法的检测任务和分割任务共享卷积特征,每个任务包含一个损失函数,多任务联合算法的整体损失函数定义为检测损失函数和分割损失函数的总和。

三、级联式网络

1:网络结构

网络结构如下图,它直接将目标检测预测结果加入到分割任务当中,从而对分割任务进行优化,分割任务首先针对来自conv3的浅层特征,将深层特征的2倍上采样与中层特征融合,再与来自浅层预测结果的特征进行融合,之后进入一个卷积模块,该卷积模块的作用主要有两个:

1:学习分割任务与目标检测任务之间的关系

2:降低特征矩阵的维度 最后经过8倍上采样得到与图像尺寸大小一致的类别矩阵1248×384×2,其中2代表针对原图的每个像素点有两个类别,之后将检测结果框直接映射到原图上,得到针对原图的一个掩膜,即目标框内部与目标框上部为0而其他地方为1,用该掩膜与得到图像分割结果想卷积,对分割结构进行优化,最后掩膜为1的位置对应的像素点预测为置信度大的类别

2:级联式网络损失函数的设计

损失函数即为预测值与真实值之间的差距,差距越小,代表算法越能更好的进行预测,所以算法都会在保证损失函数最小值大于或等于0的情况下,通过优化使损失函数得到最小的参数,多元函数的方差函数与以极大似然为原理的交叉熵函数使求最优化时常用的两个办法,因为这两个函数一定大于0,且当预测值与实际值越接近时损失越小

(1) 预测框中心点损失,采用方差损失函数:

(2) 预测框宽和高的损失,采用方差损失函数:

(3) 预测框是否存在实际目标损失,采用交叉熵损失函数:

(4) 预测类别损失函数,采用交叉熵损失函数:

目标检测总损失为:

四、多任务深度学习网络测试结果

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
6月前
|
前端开发 JavaScript 开发者
JavaScript:构建动态网络的引擎
JavaScript:构建动态网络的引擎
|
5月前
|
机器学习/深度学习 人工智能 文字识别
中药材图像识别数据集(100类,9200张)|适用于YOLO系列深度学习分类检测任务
本数据集包含9200张中药材图像,覆盖100种常见品类,已标注并划分为训练集与验证集,支持YOLO等深度学习模型。适用于中药分类、目标检测、AI辅助识别及教学应用,助力中医药智能化发展。
|
7月前
|
机器学习/深度学习 人工智能 监控
河道塑料瓶识别标准数据集 | 科研与项目必备(图片已划分、已标注)| 适用于YOLO系列深度学习分类检测任务【数据集分享】
随着城市化进程加快和塑料制品使用量增加,河道中的塑料垃圾问题日益严重。塑料瓶作为河道漂浮垃圾的主要类型,不仅破坏水体景观,还威胁水生生态系统的健康。传统的人工巡查方式效率低、成本高,难以满足实时监控与治理的需求。
|
7月前
|
机器学习/深度学习 传感器 人工智能
火灾火焰识别数据集(2200张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在人工智能和计算机视觉的快速发展中,火灾检测与火焰识别逐渐成为智慧城市、公共安全和智能监控的重要研究方向。一个高质量的数据集往往是推动相关研究的核心基础。本文将详细介绍一个火灾火焰识别数据集,该数据集共包含 2200 张图片,并已按照 训练集(train)、验证集(val)、测试集(test) 划分,同时配有对应的标注文件,方便研究者快速上手模型训练与评估。
1980 10
火灾火焰识别数据集(2200张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
|
7月前
|
机器学习/深度学习 人工智能 监控
坐姿标准好坏姿态数据集(图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
坐姿标准好坏姿态数据集的发布,填补了计算机视觉领域在“细分健康行为识别”上的空白。它不仅具有研究价值,更在实际应用层面具备广阔前景。从青少年的健康教育,到办公室的智能提醒,再到驾驶员的安全监控和康复训练,本数据集都能发挥巨大的作用。
坐姿标准好坏姿态数据集(图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
|
7月前
|
机器学习/深度学习 数据采集 算法
PCB电路板缺陷检测数据集(近千张图片已划分、已标注)| 适用于YOLO系列深度学习检测任务【数据集分享】
在现代电子制造中,印刷电路板(PCB)是几乎所有电子设备的核心组成部分。随着PCB设计复杂度不断增加,人工检测PCB缺陷不仅效率低,而且容易漏检或误判。因此,利用计算机视觉和深度学习技术对PCB缺陷进行自动检测成为行业发展的必然趋势。
PCB电路板缺陷检测数据集(近千张图片已划分、已标注)| 适用于YOLO系列深度学习检测任务【数据集分享】
|
7月前
|
机器学习/深度学习 编解码 人工智能
102类农业害虫数据集(20000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在现代农业发展中,病虫害监测与防治 始终是保障粮食安全和提高农作物产量的关键环节。传统的害虫识别主要依赖人工观察与统计,不仅效率低下,而且容易受到主观经验、环境条件等因素的影响,导致识别准确率不足。
|
6月前
|
人工智能 监控 数据可视化
如何破解AI推理延迟难题:构建敏捷多云算力网络
本文探讨了AI企业在突破算力瓶颈后,如何构建高效、稳定的网络架构以支撑AI产品化落地。文章分析了典型AI IT架构的四个层次——流量接入层、调度决策层、推理服务层和训练算力层,并深入解析了AI架构对网络提出的三大核心挑战:跨云互联、逻辑隔离与业务识别、网络可视化与QoS控制。最终提出了一站式网络解决方案,助力AI企业实现多云调度、业务融合承载与精细化流量管理,推动AI服务高效、稳定交付。
|
5月前
|
机器学习/深度学习 分布式计算 Java
Java与图神经网络:构建企业级知识图谱与智能推理系统
图神经网络(GNN)作为处理非欧几里得数据的前沿技术,正成为企业知识管理和智能推理的核心引擎。本文深入探讨如何在Java生态中构建基于GNN的知识图谱系统,涵盖从图数据建模、GNN模型集成、分布式图计算到实时推理的全流程。通过具体的代码实现和架构设计,展示如何将先进的图神经网络技术融入传统Java企业应用,为构建下一代智能决策系统提供完整解决方案。
507 0
|
6月前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
1045 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解

热门文章

最新文章