CVPR 2019|CFNet:语义分割中的共现特性

简介: 作者发现图像中存在🚀共现特征(即输入图像中与目标特征共同出现的特征)。比如在城市景观图像中,很难分辨的出海洋、湖泊、江河,但是当有帆船在图片上的时候,出现海洋的可能性很大。

🏆本篇论文提出了Coocurrent Feature Model,该模型可以利用整体场景中共现特征,辅助预测目标特征。该模型在Pascal Context 达到54.0%mIOU,在Pascal VOC 2012和ADE20K分别达到87.2%以及44.89%mIOU。


442602084330939e84261f642cd9e7c2.png


会议/期刊:CVPR2019


论文题目:《Co-occurrent Features in Semantic Segmentation》

论文链接:Co-Occurrent Features in Semantic Segmentation (thecvf.com)

开源代码:https://github.com/huy105/CFNet

解决的问题


共现特征


作者发现图像中存在🚀共现特征(即输入图像中与目标特征共同出现的特征)。比如在城市景观图像中,很难分辨的出海洋、湖泊、江河,但是当有帆船在图片上的时候,出现海洋的可能性很大。


f8f59a408cc9234bd45245523bea9fa2.png


同时,这种共现特征不仅出现在2个不同物体间,也出现在同一物体不同部位。比如要识别出长条椅和扶手椅,如果出现了扶手这个特征,那么答案是扶手椅的可能性更大,如下图:


6c6951f875d284d96836a838b817dbfb.png


现有的问题


先前的FCN距离较窄,而最近提出的ASPP或者是DASPP结构,只适用于距离较近的共现特征,不具有空间不变性


思路和主要过程


特征共现


作者把特征共现看作是一个概率问题。作者一开始使用了softmax去计算概率


image.png


经过CNN处理后的特征图X={x 1 , x 2 , . . . , x N  };


s ( x c , x t ) 表示目标特征 x t 和共现特征x c 的相似性;p ( x c ∣ x t ) 表示二者出现的概率


但作者发现,在室内场景中椅子与人共同出现,但在室外场景中却期待车辆和建筑物。简单的softmax不能考虑复杂的先验环境


所以,需要在softmax的基础上,加上图像所处的环境信息,作者在此提出了一个🔥混合softmax(Mos)


image.png


下面进行一个简单的推导:


s k ( x c , x t )表示在k这个环境的先验条件下,目标特征和共现特征的相似度。


π k 表示网络经过训练,可以判定图片所处的环境是k环境的概率。w k 是语义信息,v x 是学习到的一个矢量。

image.png


Mos允许不同语义环境下的共现特征可以有不同的先验条件。简而言之,就是考虑了一层环境因素


ACF模块


作者利用这个共现特征,设计了共现特征模块(ACF)。


image.png

其中,p ( x c ∣ x t ) 是出现共现特征则判定为目标特征的概率,ψ c 是图片上的第c个特征


从1 − N 1-N1−N将所有特征的概率都累加起来,最后得到z t ,z t 越大,则出现目标特征的概率越大


CFNet


作者设计了一个CFNet网络,如下图所示


c54b867827c3dc81eb99f981ee7be4a7.png


其中,有几个小trick:


  • 为了减少计算量,作者在Input Features这部分把H ∗ W ∗ C H*W*CH∗W∗C的图像拉伸到了( H ∗ W ) ∗ C (H*W)*C(H∗W)∗C的二维矩阵


  • 最上面的Pool是为了获取全局特征而下面的两条支路是为了获取共现特征


实验结果


提出的CFNet(ResNet101)网络在 Pascal Context上实现了当时(2019年)最先进的结果54.0%mIoU,在Pascal VOC 2012上实现了87.2%mIoU,在ADE20K上实现了44.89%mIoU


39dd20178aa1878b3acc89979ae423f9.png

相关文章
|
存储 人工智能 资源调度
|
物联网 网络协议 网络性能优化
使用抓包工具Wireshark分析IoT设备网络行为
使用抓包工具Wireshark分析IoT设备网络行为
4996 0
|
11月前
|
机器学习/深度学习 并行计算 测试技术
每天五分钟深度学习:解决for循环效率慢的关键在于向量化
向量化是提升计算效率的重要技术,尤其是在处理大规模数据和进行复杂运算时。通过将for循环转换为向量或矩阵运算,向量化能够充分利用底层高效库和现代CPU的并行计算能力,从而大幅提高运算速度。在深度学习中,向量化是实现高效神经网络训练和预测的关键。
350 23
|
9月前
|
机器学习/深度学习 编解码 监控
《深度解析转置卷积:原理与多元应用场景》
转置卷积(反卷积)是深度学习中用于上采样的重要操作,通过在输入间插入零填充以放大特征图。它广泛应用于图像生成、语义分割、超分辨率重建和CNN可视化等领域,能够学习更优的上采样方式。尽管计算成本较高且可能引入伪像,但其在多个任务中发挥着关键作用,并随着技术发展不断优化。
311 5
|
缓存 API 持续交付
阿里巴巴热卖商品推荐API接口的获取与应用
阿里巴巴推出热卖商品推荐API接口,基于AI算法,根据用户行为推荐商品,涵盖名称、价格、描述等信息。本文介绍其获取与应用方法,帮助商家和开发者提高推荐精准度和用户满意度,优化库存管理和营销策略,提升整体销售效果。
924 0
|
11月前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
526 11
|
云安全 人工智能 自然语言处理
|
11月前
|
弹性计算 负载均衡 安全
云端问道-Web应用上云经典架构方案教学
本文介绍了企业业务上云的经典架构设计,涵盖用户业务现状及挑战、阿里云业务托管架构设计、方案选型配置及业务初期低门槛使用等内容。通过详细分析现有架构的问题,提出了高可用、安全、可扩展的解决方案,并提供了按量付费的低成本选项,帮助企业在业务初期顺利上云。
306 0
|
消息中间件 存储 Java
【微服务】RabbitMQ七种消息收发方式🌱
MQ全称为Message Queue,即消息队列。“消息队列”是在消息的传输过程中保存消息的容器。它是典型的:生产者、消费者模型。生产者不断向消息队列中生产消息,消费者不断的从队列中获取消息。
809 0
【微服务】RabbitMQ七种消息收发方式🌱
|
网络协议 安全 数据挖掘
F5《企业DNS建设白皮书》中的DNS解析服务器最佳实践
F5《企业DNS建设白皮书》中的DNS解析服务器最佳实践
393 0
F5《企业DNS建设白皮书》中的DNS解析服务器最佳实践