【提示学习】Label prompt for multi-label text classification

简介:   标签文本分类的关键问题之一是提取和利用标签之间的相关性,但直接建模标签之间的相关性很难。  LP-MTC设计了多标签文本分类模板,将标签整合到预训练语言模型的输入中,可以捕获标签之间的相关性以及标签与文本之间的语义信息,从而有效地提高模型的性能。

阅读摘要


 标签文本分类的关键问题之一是提取和利用标签之间的相关性,但直接建模标签之间的相关性很难。


 LP-MTC设计了多标签文本分类模板,将标签整合到预训练语言模型的输入中,可以捕获标签之间的相关性以及标签与文本之间的语义信息,从而有效地提高模型的性能。


1 介绍


 由文本分类引出多标签文本分类。


 随之介绍解决MTC的三个视角:


 1.捕获文档信息;

 2.提取文档与标签的判别信息;

 3.挖掘标签相关性


 阐述二元分类、CNN、注意力机制会忽略标签相关性;生成式网络、学习标签表示、建模标签关联的问题所在:当标签文本之间没有太大差异或缺少标签文本时,这些模型可能会在分类上失败。此外,在未知和复杂的标签空间中对标签的关联进行建模是非常具有挑战性的。


 然后从PLM过渡到使用Prompt学习。


 LP-MTC利用语言模型学习到的提示模板中的语义信息,学习标签与文本之间的关系;LP-MTC更通用,不需要针对不同的数据集进行定制。


2 相关工作


 介绍了多标签文本分类、提示学习。写的比较中规中矩,没有特殊的地方。


3 基础模型


 介绍了一下Prompt Learning的基本结构,即PVP模式。



PVP模式可以参考我先前的博客:

1、《基于提示学习的小样本文本分类方法》

2、Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classific

3、Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference


4 LP-MTC


  介绍了文章提出的模型。




 提出了两个Trick。一是把文本标签按位置进行MASK,二是联合BERT模型原有的MLM进行联合训练。


4.1 提示模板

 对于每个标签,有三个值:image.png,分别表示是、否、MASK。

1698400205430.png



4.2 联立MLM模型


 将标签预测与语言模型的MLM任务结合起来。其实就是利用了BERT模型原本的MLM任务,这在> Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference论文中也有使用。


4.3 损失函数


 因为有一个prompt任务,一个MLM任务,要加权一下:


.


6 分析

 主要说一下参数image.png的设置,和位置编码的效果。


 参数在0.01比较好:



 消融实验还设置了三种模板形式:


  1、普通模板


  2、不加位置编码


  3、加位置编码



 效果如下,说明加位置编码的模板好:





相关文章
|
计算机视觉 Python
Jetson 学习笔记(六):cv2调用CSI摄像头(jetson nx/nano)、打开海康摄像头、打开电脑摄像头
这篇文章介绍了在不同平台上接入并显示摄像头视频流的方法,包括海康摄像头的RTSP连接、电脑内置摄像头的直接读取、Jetson NX/Nano通过CSI接口和USB接口的操作,以及Jetson Nano通过Gstreamer管道和jetcam库的使用,并提供了相应的代码示例。
1133 1
|
弹性计算 网络安全 数据安全/隐私保护
使用SSH远程登录阿里云ECS服务器
远程连接服务器以及配置环境
19707 0
使用SSH远程登录阿里云ECS服务器
|
开发工具 数据安全/隐私保护 git
Git报错:remote: HTTP Basic: Access denied的解决方法
Git报错:remote: HTTP Basic: Access denied的解决方法
3318 0
Git报错:remote: HTTP Basic: Access denied的解决方法
|
9月前
|
人工智能 负载均衡 调度
COMET:字节跳动开源MoE训练加速神器,单层1.96倍性能提升,节省百万GPU小时
COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,通过细粒度的计算-通信重叠技术,显著提升分布式训练效率,支持多种并行策略和大规模集群部署。
523 9
|
5月前
|
Linux Docker Windows
windows docker安装报错适用于 Linux 的 Windows 子系统必须更新到最新版本才能继续。可通过运行 “wsl.exe --update” 进行更新。
适用于 Linux 的 Windows 子系统需更新至最新版本(如 wsl.2.4.11.0.x64.msi)以解决 2025 年 Windows 更新后可能出现的兼容性问题。用户可通过运行 “wsl.exe --update” 或访问提供的链接下载升级包进行更新。
2011 0
|
9月前
|
人工智能 前端开发 算法
Vibe Draw:涂鸦秒变3D模型!开源AI建模神器解放创意生产力
Vibe Draw 是一款基于AI技术的开源3D建模工具,通过Next.js和FastAPI构建,能将用户绘制的2D草图智能转化为3D模型,并支持文本提示优化和场景构建。
630 35
Vibe Draw:涂鸦秒变3D模型!开源AI建模神器解放创意生产力
|
11月前
|
安全 网络安全 开发工具
解决Ascend上vllm运行时出现urllib3.exceptions.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED]
在使用vllm模型时,运行示例代码下载模型文件时遇到了SSL安全校验问题。临时解决方案是修改`requests/sessions.py`文件中`request`函数的`verify`参数默认值为`False`。
|
存储 Kubernetes 中间件
【中间件-keycloak】第一次改开源中间件keycloak总个结
【中间件-keycloak】第一次改开源中间件keycloak总个结
904 92
【中间件-keycloak】第一次改开源中间件keycloak总个结
|
Linux Shell Python
如何在 Linux 中安装和使用 pipx?
如何在 Linux 中安装和使用 pipx?
2313 0
如何在 Linux 中安装和使用 pipx?
|
安全 测试技术 API
API测试:了解API接口测试与API接口测试指南
本文为您提供API接口测试的全面指南。从基础概念到测试方法,再到最佳实践,本文将帮助您深入了解API测试,确保您的API稳健、高效。