备案控制台

开发者社区机器之心文章正文

卷积越大性能越强！RepLKNet一作在线分享：Transformer阴影下的超大卷积核复兴

2023-05-15 145

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 卷积越大性能越强！RepLKNet一作在线分享：Transformer阴影下的超大卷积核复兴

你有多久没调过 kernel size 了？在下游任务上，Transformer 明显优于传统 CNN，这是因为 Transformer 本质更强吗？传统堆叠大量 3x3 卷积的 CNN 设计模式是最优的吗？

最近，清华大学、旷视科技等机构的一项工作表明，CNN 中的 kernel size 其实是一个非常重要但总是被人忽略的设计维度：在现代模型设计的加持下，卷积核越大越暴力，既涨点又高效，甚至大到 31x31 都非常 work。即便在大体量下游任务上，超大卷积核模型 RepLKNet 与 Swin 等 Transformer 相比，性能也更好或相当。

文章标签：

机器学习/深度学习

设计模式

-开发达人-

目录

相关文章

阿里云运维工程师

|

7月前

|

机器学习/深度学习人工智能数据安全/隐私保护

2025年NVIDIA RTX 4090服务器租赁价格与选型详解

随着AI训练、深度学习与图形渲染需求激增，NVIDIA RTX 4090显卡成为算力租赁市场的热门选择。本文从价格体系、配置适配、成本优化三方面解析4090服务器租赁策略，涵盖短租长租价格差异、主流平台对比、硬件配置建议及成本优化方案，助您精准匹配业务需求。此外，还介绍了阿里云高性能GPU实例作为替代方案，提供稳定性和生态集成优势。

阿里云运维工程师

6710 22 22

wljslmz

|

机器学习/深度学习自然语言处理算法

什么是嵌入层？为什么它们在 LLM 中很重要？

【8月更文挑战第13天】

wljslmz

1368 1 1

云小弟指导上云

|

存储弹性计算人工智能

2024年阿里云服务器多少钱一年？阿里云服务器新版租用活动价格表

2024年租用阿里云服务器多少钱一年？这是很多初次选择阿里云服务器的用户比较关心的问题，为此，小编特意查询并整理了一份截止目前阿里云服务器最新版的租用活动价格表。目前阿里云服务器经济型e实例2核2G3M带宽99元一年、通用算力型u1实例2核4G5M带宽199元一年、轻量应用服务器2核2G3M带宽只要61元一年、热卖游戏联机服务器4核16G10M带宽26.52元1个月起。

云小弟指导上云

610 2 2

2024年阿里云服务器多少钱一年？阿里云服务器新版租用活动价格表

编程技术君

|

前端开发容器

带你读《2022技术人的百宝黑皮书》——下一代响应式Web设计：组件驱动式Web设计（19）

带你读《2022技术人的百宝黑皮书》——下一代响应式Web设计：组件驱动式Web设计（19）

编程技术君

122 0 0

小攻云攻略

|

人工智能大数据新制造

任我行软件与阿里云深化合作

任我行软件与阿里云在杭州签署全面合作协议。未来，阿里云将全面开放云计算、人工智能等核心技术，支撑任我行软件加速创新，推动核心产品以SaaS化方式服务80多万家中小企业客户。本文转载自阿里云公众号

小攻云攻略

280 0 0

Mindtechnist

|

API C语言

【数据结构】双向链表的API及C语言实现（一）

【数据结构】双向链表的API及C语言实现

Mindtechnist

222 0 0

【数据结构】双向链表的API及C语言实现（一）

龙哥手记

|

存储关系型数据库 MySQL

《MYSQL必知必会》读书笔记（四）

基础

龙哥手记

284 0 0

桃花键神

|

Ubuntu Java 开发工具

Ubuntu 安装jdk17详细配置教程（傻瓜式教程）

Ubuntu 安装jdk17详细配置教程（傻瓜式教程）

桃花键神

1920 0 0

Ubuntu 安装jdk17详细配置教程（傻瓜式教程）

2025「AI安全」全球攻防赛小编

|

8天前

|

人工智能运维安全

从“裸奔”到“金钟罩”：AI身份凭据安全的进化之路

构建身份权限安全，护航企业数据合规

2025「AI安全」全球攻防赛小编

1197 15 19

弹性计算-百晓生

|

6天前

|

人工智能异构计算

敬请锁定《C位面对面》，洞察通用计算如何在AI时代持续赋能企业创新，助力业务发展！

敬请锁定《C位面对面》，洞察通用计算如何在AI时代持续赋能企业创新，助力业务发展！

弹性计算-百晓生

1025 11 13

热门文章

最新文章

互联网大厂程序员岗位职级划分

【资料合集】红包在线技术峰会回顾集锦：讲义PDF+活动视频！

那些年，人们问王坚博士的33个问题

世界互联网大会发布15项领先科技成果

GNU make manual 翻译(十五)

SSRS 2012 聚合函数 -- 介绍

微软将停止免费提供15GB OneDrive空间

Node.js开发者必须熟悉的四个JavaScript概念

Harp – 内置常用预处理器的静态 Web 服务器

Sql Server内置函数实现MD5加密

基于C#实现的支持文件传输的Socket聊天室

Gateway 网关坑我！被这个404 问题折腾了一年？

Service Mesh：原则、挑战和演变

DDD领域驱动设计：实践中的聚合

【详细教程】如何在Ubuntu上本地部署Dify？

Dapr：用于构建分布式应用程序的便携式事件驱动运行时

阿里云gpu云服务器收费价格，热门实例简介和最新按量、1个月、1年收费标准参考

游戏显卡驱动，NVIDIA App ，0xc000007b，amd显卡驱动下载，解决游戏慢，游戏卡等问题

基于python大数据的天气可视化分析预测系统

AIRS/Aqua L1B 可见光/近红外 (VIS/NIR) 地理定位和校准辐射 V005 (AIRVBRAD) 在 GES DISC

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

蛋白质语言模型 ProGen：在实验室合成由 AI 预测的蛋白质