备案控制台登录注册

开发者社区人工智能文章正文

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

2023-02-24 221 发布于辽宁

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

·阅读摘要：

本文在Transformer模型的基础上，提出改进方案，把Transformer里面的自注意力机制，改成CNN。

·参考文献：

[1] ACT: an Attentive Convolutional Transformer for Efficient Text Classification

【注】：众所周知，Transformer是超越RNN、CNN的模型，Transformer中最有新意的就是不使用RNN、CNN，而使用自注意力机制，从而使得Transformer模型表现卓越。

而本文提出的ACT模型就是把Transformer中的自注意力机制替换成CNN，我觉得这篇论文是否有意义，其实应该和Transformer的作者battle一下，哈哈。

[1] ACT模型

先看一下Transformer模型：

再看ACT模型：

所以说，ACT模型只是把Transformer的Scaled Dot-Product Attention模块换成了attentive convolution mechanism。

对于attentive convolution mechanism模块，主要就是CNN加了一个Global feature representation。

【注】：说白了就是普通的CNN是卷积–>池化；而论文提出的CNN是卷积+池化，其中卷积部分称为提取局部信息，池化部分称为提取全局信息。

文章标签：

机器学习/深度学习

数据挖掘

征途黯然。

+关注

目录

打赏

0

0

0

0

174

相关文章

Bigcrab__

|

9月前

|

机器学习/深度学习数据挖掘 API

[FastText in Text Classification]论文实现：Bag of Tricks for Efficient Text Classification

[FastText in Text Classification]论文实现：Bag of Tricks for Efficient Text Classification

Bigcrab__

55 2 2

Trouble..

|

自然语言处理算法

SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model

在社交媒体上，面临着大量的知识和信息，一个有效的关键词抽取算法可以广泛地被应用的信息检索和自然语言处理中。传统的关键词抽取算法很难使用外部的知识信息。

Trouble..

183 0 0

SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model

北村南

|

机器学习/深度学习数据挖掘

【论文解读】Co-attention network with label embedding for text classification

华南理工出了一篇有意思的文章，将标签和文本进行深度融合，最终形成带标签信息的文本表示和带文本信息的标签表示。

北村南

292 1 1

Trouble..

|

机器学习/深度学习编解码自然语言处理

DeIT:Training data-efficient image transformers & distillation through attention论文解读

最近，基于注意力的神经网络被证明可以解决图像理解任务，如图像分类。这些高性能的vision transformer使用大量的计算资源来预训练了数亿张图像，从而限制了它们的应用。

Trouble..

593 0 0

Trouble..

|

机器学习/深度学习自然语言处理数据可视化

SimCSE: Simple Contrastive Learning of Sentence Embeddings论文解读

本文介绍了SimCSE，一个简单的对比学习框架，极大地推进了最先进的句子嵌入。我们首先描述了一种无监督方法，该方法采用一个输入句子，并在一个对比目标中预测自己

Trouble..

347 0 0

北村南

|

数据可视化数据挖掘

【论文解读】Dual Contrastive Learning：Text Classification via Label-Aware Data Augmentation

北航出了一篇比较有意思的文章，使用标签感知的数据增强方式，将对比学习放置在有监督的环境中，下游任务为多类文本分类，在低资源环境中进行实验取得了不错的效果

北村南

522 0 0

征途黯然。

|

机器学习/深度学习存储数据挖掘

【文本分类】Bag of Tricks for Efficient Text Classification

【文本分类】Bag of Tricks for Efficient Text Classification

征途黯然。

112 0 0

【文本分类】Bag of Tricks for Efficient Text Classification

征途黯然。

|

机器学习/深度学习自然语言处理数据挖掘

【文本分类】A C-LSTM Neural Network for Text Classification

【文本分类】A C-LSTM Neural Network for Text Classification

征途黯然。

179 0 0

【文本分类】A C-LSTM Neural Network for Text Classification

征途黯然。

|

机器学习/深度学习存储人工智能

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

征途黯然。

116 0 0

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

征途黯然。

|

机器学习/深度学习自然语言处理算法

【文本分类】Convolutional Neural Networks for Sentence Classification

【文本分类】Convolutional Neural Networks for Sentence Classification

征途黯然。

111 0 0

【文本分类】Convolutional Neural Networks for Sentence Classification

热门文章

最新文章

阿里云认证介绍 - 线上考试报名指南（ACA/ACP/ACE）

阿里云人脸识别使用流程简介

windows 使用virtualenv

IBatis.net介绍

编写了一个文件编码转换器。

OSPF协议学习笔记(一)

Silverlight动画制作之From/To/By基本动画

前端学习 -- image标签和meta标签

java学习中的一些疑惑解答

Android隐藏虚拟按键，关闭开机动画、开机声音

Linux用户组管理“小窍门”

Linux用户账户管理“小窍门”

Linux权限揭秘“Root与Sudo”

算法系列之搜索算法-深度优先搜索DFS

Deepseek 本地部署“网页版”与“软件版”超级详细教学（deepseek+Ollama+OpenWebUI+Chatbox AI+Cherry Studio）

ToddlerBot：告别百万经费！6000刀就能造人形机器人，斯坦福开源全套方案普及机器人研究

Aider：27.6K Star！这个终端AI编程神器能用语音改代码，自动生成Git记录并提交，接入DeepSeek斩获编程基准最高分

Magma：微软放大招！新型多模态AI能看懂视频+浏览网页+UI交互+控制机器人，数字世界到物理现实无缝衔接

Redis原理—1.Redis数据结构

Weevil-Optimizer象鼻虫优化算法的matlab仿真实现

相关电子书

更多

Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition

Understanding and Improving Layer Normalization论文

DEGREE: Deep Learning For Graph Embedding

下一篇

阿里云oss简介和如何对接使用

目录

[1] ACT模型

目录

你好，我是AI助理

可以解答问题、推荐解决方案等