【多标签文本分类】融合CNN-SAM与GAT的多标签文本分类模型

2023-02-24 302

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型训练 PAI-DLC，100CU*H 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

交互式建模 PAI-DSW，每月250计算时 3个月

简介： 【多标签文本分类】融合CNN-SAM与GAT的多标签文本分类模型

·阅读摘要：

在本文中，作者基于CNN、Attention、GAT提出CS-GAT模型，在一些通用数据集上，表现良好。

·参考文献：

[1] 融合CNN-SAM与GAT的多标签文本分类模型

本篇论文写的比较好，在介绍模型的时候，条理清晰。有借鉴意义。

【注一】：个人觉得本文是标准的“模型缝合”的产出，眼下这种出论文的方式还是很香的。

[1] 参考论文信息

论文名称：《融合CNN-SAM与GAT的多标签文本分类模型》

发布期刊：《计算机工程与应用》

期刊信息：CSCD扩展

[2] 模型

模型图如下：

文本与标签词嵌入层：使用了glove的预训练词向量，对文本数据和标签都是使用glove来转化词向量的。

BiLSTM层：双向LSTM，用的很多了。

融合局部与全局的文本特征提取层：这里想要对BiLSTM层的输出H HH提取局部信息和全局信息。

· 对于局部信息，采用多卷积核大小的CNN+最大Pooling来提取。

· 对于全局信息，采用注意力机制提取。

· 最后，把提取出来的局部信息和全局信息拼接即可。

【注二】：CNN+Pooling、Attention是比较基础的文本分类领域知识。也比较常用这些技术。

标签图注意力层：这是GAT模型的内容。为标签编码成图结构。

标签文本交互层：把全局标签信息表示与文本上下文语义信息表示做交互注意力计算。

自适应融合层：把标签文本交互层和融合局部与全局的文本特征提取层的输出进行融合，然后就可以分类了。

【注三】：GAT模型比较抽象，论文地址：https://arxiv.org/pdf/1710.10903.pdf