【文本分类】《融合注意力和剪裁机制的通用文本分类模型》

2023-02-25 157

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型训练 PAI-DLC，100CU*H 3个月

交互式建模 PAI-DSW，每月250计算时 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

简介： 【文本分类】《融合注意力和剪裁机制的通用文本分类模型》

·阅读摘要：

针对实际场景中长短文本大量的情况，提出了双通道注意力机制与长文本裁剪机制来改进文本分类模型，最终提高了精度。

·参考文献：

[1] 融合注意力和剪裁机制的通用文本分类模型

参考论文信息

论文名称：《融合注意力和剪裁机制的通用文本分类模型》

发布期刊：《计算机应用》

期刊信息：CSCD扩展

本文主要是针对数据集中长文本和短文本互相混和的情况，设计了一些改进。主要有六：

·词向量表示模块

·卷积神经网络模块

·双通道注意力模块

·长文本裁剪模块

·循环神经网络模块

·融合分类模块

其中，值得说的是双通道注意力模块与长文本裁剪模块，其他的模块都是比较基础的。

模型结构

模型结构如下：

【注】：这个网络结构，我只能说是“简单的复杂”。纯把数据倒来倒去，然后拼接在一起，做个分类。它做了这么多工作，其实很有可能会产生debuff，甚至不如直接在BERT后面接个分类结果好。但是实践出真知，我持保留意见。

【注】：上面的模型除了数据倒来倒去，原理还是较为简单的，双通道注意力模块与长文本裁剪模块值得看一下。

·双通道注意力模块