备案控制台

开发者社区人工智能文章正文

可变卷积原理总结

2023-06-06 199

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 可变卷积原理总结

1 背景

传统的CNN存在固定几何形状的缺陷: 卷积单元在固定位置对输入特征图进行采样。~~池化层以固定比率降低空间分辨率；一个ROI（感兴趣区域）池化层将一个ROI分割成固定的空间单元；缺乏处理几何变换的内部机制等。~~

上述缺陷会引起下列问题：

1. 同一CNN层中所有激活单元的感受野大小是相同的，这对于在空间位置上编码语义的高级CNN层是不需要的
2. 对于具有精细定位的视觉识别的实际问题，不同的位置对象可能具有不同尺度或形状。因此，固定位置进行采样很难提取完整的对象特征。尺度或感受野大小的自适应确定是可取的。
为了解决上面的问题，提出了可变卷积，在文本检测DBNet等文章中使用。

上图左侧是传统的CNN提取特征，由于固定位置进行下采样，很难将羊的位置全部覆盖进行下采样，即没有完整提取羊的特征。

右侧是可形变卷积，由于卷积的形状自适应，进行的下采样卷积核形状不定，可以覆盖整个羊，从而提取到完整羊的特征。

2 可变卷积 DCN1

其中图(a)是传统CNN，(b)©(d)是可变形卷积。

2.1 传统卷积

假设图(a)中虚线框是一个特征图F，9个绿色点构成了一个卷积核，那么该点的值应该是：

其中是卷积核在位置i的值，而(x,y)是卷积核该位置对应图像中一点的坐标。

2.2 可变卷积

可变卷积的计算与传统CNN的类似，只是多了一个偏移量：

该偏移量使得参与计算的点发生变化。如图(b)中，卷积核遍历到了9个绿色点的位置，但是参与计算的是通过9个绿色点和偏移量得到的蓝色点。相当于在控制卷积核的形状。

那么偏移量是如何生成的呢？

将输入特征图通过一个卷积核，输出为大小为原特征图大小，out_channlel为2，代表x和y方向山的偏移量。然后提取ROI区域得到卷积核上在该次采样时的偏移量，如下图所示：

了解上面的东西后，再总结一下DCN 1的过程：

本质上，我们利用的卷积核还是按照传统CNN一样遍历。但是遍历到某个位置后，由于偏量，我的结果是另外位置和卷积核参数的计算结果。

如上图，我们卷积核遍历到了绿色的位置。但是偏量使得我们真正参与计算的是蓝色的点。

3 可变卷积 DCN 2

DCN 2在DCN 1的基础上添加了一个采样点权重：

这个采样点的区域我们不感兴趣，则把权重学习为0即可。

4 参考文章

https://paddlepedia.readthedocs.io/en/latest/tutorials/CNN/convolution_operator/Deformable_Convolution.html

文章标签：

编解码

机器学习/深度学习

ThreeWhiteDots

目录

相关文章

AI浩

|

机器学习/深度学习

普通卷积、分组卷积和深度分离卷积概念以及参数量计算

普通卷积、分组卷积和深度分离卷积概念以及参数量计算

AI浩

1257 0 1

普通卷积、分组卷积和深度分离卷积概念以及参数量计算

Limiiiing

|

12天前

|

算法计算机视觉

YOLOv11改进策略【卷积层】| AKConv：具有任意采样形状和任意参数数量的卷积核

YOLOv11改进策略【卷积层】| AKConv：具有任意采样形状和任意参数数量的卷积核

Limiiiing

20 0 0

YOLOv11改进策略【卷积层】| AKConv：具有任意采样形状和任意参数数量的卷积核

YOLO创新改进大师

|

9月前

|

机器学习/深度学习算法计算机视觉

YOLOv8改进-论文笔记】 AKConv(可改变核卷积)：任意数量的参数和任意采样形状的即插即用的卷积

AKConv是一种可改变核卷积，旨在解决传统卷积的局限，包括固定大小的卷积窗口和卷积核尺寸。AKConv提供灵活的卷积核参数和采样形状，适应不同尺度特征。其创新点包括：1）支持任意大小和形状的卷积核；2）使用新算法确定初始采样位置；3）应用动态偏移调整采样位置；4）优化模型参数和计算效率。AKConv已应用于YOLOv8，提高网络性能。相关代码可在<https://github.com/CV-ZhangXin/AKConv>找到。

YOLO创新改进大师

275 1 1

游客wkzdk2qklv76k

|

6月前

|

机器学习/深度学习 Shell 计算机视觉

一文搞懂卷积神经网络卷积算子应用举例池化激活函数

这篇文章通过案例详细解释了卷积神经网络中的卷积算子应用、池化操作和激活函数，包括如何使用卷积算子进行边缘检测和图像模糊，以及ReLU激活函数如何解决梯度消失问题。

游客wkzdk2qklv76k

110 0 0

YOLO创新改进大师

|

7月前

|

机器学习/深度学习算法计算机视觉

【YOLOv10改进 -卷积Conv】 AKConv(可改变核卷积)：任意数量的参数和任意采样形状的即插即用的卷积

AKConv是一种可改变核卷积，旨在解决传统卷积的局限，包括固定大小的卷积窗口和卷积核尺寸。AKConv提供灵活的卷积核参数和采样形状，适应不同尺度特征。其创新点包括：1）支持任意大小和形状的卷积核；2）使用新算法确定初始采样位置；3）应用动态偏移调整采样位置；4）优化模型参数和计算效率。AKConv已应用于YOLOv8，提高网络性能。相关代码可在<https://github.com/CV-ZhangXin/AKConv>找到。

YOLO创新改进大师

124 1 1

zhilong666

|

机器学习/深度学习算法

什么是卷积？（含如何实现卷积源码）

什么是卷积？（卷积简单实现源码）

zhilong666

147 0 0

什么是卷积？（含如何实现卷积源码）

greework

|

机器学习/深度学习 PyTorch 算法框架/工具

【PyTorch】什么时候使用数组形式创建多个卷积层

【PyTorch】什么时候使用数组形式创建多个卷积层

greework

109 0 0

游客nekoul5qfopxi

|

机器学习/深度学习编解码移动开发

CVPR2020丨UDVD：用于可变退化的统一动态卷积超分辨率网络

近些年，基于CNN的方法在图像超分辨率问题上表现出出色的性能。然而大多数方法基于一种退化或者是多种退化的组合，甚至去训练特定的模型以适应特定的退化过程。因此更加实际的方法是训练单独的模型以适用多样可变的退化。

游客nekoul5qfopxi

482 0 0

CVPR2020丨UDVD：用于可变退化的统一动态卷积超分辨率网络

是八哥啊~

|

存储 Java 数据安全/隐私保护

java实现稀疏数组

稀疏数组是一种为了节约存储空间而产生的数据结构，本质上稀疏数组就是一个普通的二维数组。其实在真实的应用中，稀疏数组的用武之地很少，起码笔者工作了几年，是没有发现稀疏数组的用武之地的（感觉游戏领域可能会用到），但是作为数据结构的一种，我们学习他还是可以得到一些启发的，比如使用时间换空间的思想，反过来使用空间换时间不也是可以的吗。所以学习他不一定非要用，但是肯定会对自己的思维有帮助。

是八哥啊~

106 0 0

Deephub

|

机器学习/深度学习存储运维

基于可变自动编码器(VAE)的生成建模,理解可变自动编码器背后的原理

基于可变自动编码器(VAE)的生成建模,理解可变自动编码器背后的原理

Deephub

411 0 0

基于可变自动编码器(VAE)的生成建模,理解可变自动编码器背后的原理

热门文章

最新文章

解决kafka集群由于默认的__consumer_offsets这个topic的默认的副本数为1而存在的单点故障问题

使用 Docker 高效搭建本地开发环境（详细教程）

如何使用java代码导出word

《Python编程从0到1》笔记1——表达式的风格（前缀、中缀、后缀）

Nginx目录文件列表显示

中移动与阿里巴巴将在四大领域展开全面战略合作

mysql 主从复制配置

google guice @inject comments

html页面中event的常见应用

微软要在年内推出IPTV平台抢占客厅市场

一级倒立摆平衡控制系统MATLAB仿真,可显示倒立摆平衡动画,对比极点配置,线性二次型,PID,PI及PD五种算法

基于SOA海鸥优化算法的三维曲面最高点搜索matlab仿真

基于PI控制的三相整流器控制系统的simulink建模与仿真,包含超级电容充电和电机

MCMS：Star 28.1k,还在为CMS系统发愁？这款开源神器让内容管理变得像搭积木一样简单！

XJ-Survey：这个让滴滴日均处理1.2亿次问卷请求的开源系统，今天终于公开了它的架构密码！

CPU can only see the threads

Java+机器学习基础：打造AI学习基础

使用 pipx 安装并执行 Python 应用程序 (1)

国产AI神器Deepseek，本地离线使用教程！

短视频创作助手 | AI剧本生成与动画创作

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型