【论文解读】Co-attention network with label embedding for text classification

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时计算 Flink 版,1000CU*H 3个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 华南理工出了一篇有意思的文章,将标签和文本进行深度融合,最终形成带标签信息的文本表示和带文本信息的标签表示。

🍥关键词:文本分类、多分类、多标签、标签嵌入

 

🍥发表期刊:Neurocomputing 2022  A2

🍥原始论文:https://mqianliu.github.io/files/CNLE_Neurocomputing22.pdf

🍥代码链接:https://github.com/lizhaoliu-Lec/CNLE

华南理工出了一篇有意思的文章,将标签和文本的序列信息进行深度融合,最终形成文本增强的标签表示和标签增强的文本表示。

一、Introduction

在本文中,我们试图通过进一步构造具有文本到标签注意的文本参与标签表示来利用标签信息。为此,我们提出了一种带有标签嵌入的协同注意网络(CNLE),该网络将文本和标签联合编码到它们相互参与的表示中。通过这种方式,该模型能够兼顾两者的相关部分。实验表明,我们的方法在7个多类分类基准和2个多标签分类基准上取得了与以前最先进的方法相比较不错的结果。

Paper中设计了一个网络模型,其包括Text-Lable Co-attentive Encoder(TLCE)和Adaptive Label Decoder(ALD)

image.gif编辑 二、Model

2.1 TLCE

假设文本x包含m个词和标签序列l包含c个标签

使用预训练词向量GloVe模型对单词进行嵌入,使用随机初始化对标签进行嵌入,随后使用两个独立的线性投影层进行投影,得到,

为了捕获文本序列中的上下文信息和标签序列中的相关性,使用BiLSTM来进行特征提取

为了获得文本参与的标签表示和标签参与的文本表示,使用改编的MultiHead Self-Attention

为了进一步利用标签连接文本编码的上下文信息和文本连接标签编码的相关性,使用两个独立的BiLSTM来传播文本序列和标签序列

到这里为止,编码工作就完成了

2.2 ALD

随后需要进行解码工作,主要使用了两个步骤

1)使用使用LSTM解码器获得隐藏状态、单元状态和循环上下文状态

2)通过自适应分类器计算每个类的概率

使用标准LSTMCell来生成标签序列进行解码操作,是隐藏层状态,是cell状态,是标签表示,是文本表示。

获得隐藏层状态之后,加上文本序列来计算注意力权重

那么,当前状态的上文表示为

获得了隐藏层状态后与标签序列一起来生成自适应分类器

损失函数的定义为

这里的损失函数既可以用于单标签也可以用于多标签

三、Experiment

数据集包括了7个多类分类数据集和2个多标签分类数据集,均为经典数据集

image.gif编辑

准确率

image.gif编辑

micro-F1

image.gif编辑

image.gif编辑

消融实验

image.gif编辑

image.gif编辑

对比实验

image.gif编辑

共享权重策略实验

image.gif编辑

共享参数对分类的效果没有多大影响,因为这样的模型使得标签和文本在语义空间上已经有高度的相似性。

四、Conclusion

这样的注意力机制还是蛮有意思的,将标签信息与文本信息进行融合,获得标签参与的文本表示和文本参与的标签表示。在多标签和低资源文本分类问题上可以进行借鉴。

目录
相关文章
|
小程序 JavaScript
【微信小程序】-- 自定义组件 - behaviors(三十九)
【微信小程序】-- 自定义组件 - behaviors(三十九)
|
12月前
|
人工智能 开发者
【阅读十分钟,百分百成功】——通过大模型实现对客服回答的质量评估
本文章基于业务实践,总结有关客服质检场景的解决方案和处理经验,为相似场景提供可行的借鉴方法。
1451 121
|
存储 运维 监控
在Linux中,如何解决keepalived脑裂问题?
在Linux中,如何解决keepalived脑裂问题?
|
12月前
|
数据采集 自然语言处理 Serverless
GPT-Sovits文本转语音服务测评报告
本文介绍了一款基于阿里云函数计算平台部署的GPT-Sovits文本生成语音服务。该服务以其高度仿真的声音合成效果和简便的部署方式受到关注。文章详细描述了技术架构、部署流程、功能测试及性能评估等内容,展示了GPT-Sovits在语音合成领域的卓越表现和广泛的应用前景。
758 8
|
负载均衡 Java API
Java一分钟之-Spring Cloud OpenFeign:声明式服务调用
【6月更文挑战第9天】Spring Cloud OpenFeign是声明式服务调用库,简化了微服务间调用。通过动态代理,它允许开发者用Java接口调用HTTP服务,支持服务发现、负载均衡。本文介绍了OpenFeign的基本概念,展示了如何添加依赖、开启客户端和定义服务接口。还讨论了接口调用失败、超时重试和日志配置等问题及其解决方案,并提供了自定义Feign配置的代码示例。通过学习,读者可以更好地在微服务架构中使用OpenFeign进行服务通信。
641 4
|
12月前
|
人工智能
HunyuanVideo:腾讯推出的开源视频生成模型,参数高达130亿
腾讯推出的开源视频生成模型HunyuanVideo,拥有130亿参数,是目前参数量最大的开源视频模型之一。该模型具备物理模拟、高文本语义还原度、动作一致性和电影级画质等特性,能生成带有背景音乐的视频,推动了视频生成技术的发展和应用。
541 16
HunyuanVideo:腾讯推出的开源视频生成模型,参数高达130亿
|
Ubuntu Linux C语言
Ubuntu安装笔记(二):ubuntu18.04编译安装opencv 3.4.0 opencv_contrib3.4.0
本文介绍了在Ubuntu 18.04系统上编译安装OpenCV 3.4.0及其扩展包opencv_contrib 3.4.0的详细步骤,包括下载源码、安装依赖、配置CMake和编译安装,以及常见问题的解决方法。
1297 1
Ubuntu安装笔记(二):ubuntu18.04编译安装opencv 3.4.0 opencv_contrib3.4.0
|
机器学习/深度学习 编解码 监控
算法金 | 深度学习图像增强方法总结
**图像增强技术概括** 图像增强聚焦于提升视觉效果和细节,广泛应用于医学、遥感等领域。空间域增强包括直方图均衡化(增强对比度)、对比度拉伸、灰度变换、平滑滤波(均值、中值)和锐化滤波(拉普拉斯、高通)。频率域增强利用傅里叶变换、小波变换,通过高频和低频滤波增强图像特征。现代方法涉及超分辨率重建、深度学习去噪(如CNN、Autoencoder)、图像修复(如GAN)和GANs驱动的多种图像处理任务。
784 14
算法金 | 深度学习图像增强方法总结
|
容器
Flutter Container设置 width 无效
Flutter Container设置 width 无效
|
人工智能 弹性计算 安全
深入理解 Serverless 计算的并发度
深入理解 Serverless 计算的并发度
44993 33