备案控制台登录注册

开发者社区人工智能文章正文

【提示学习】Prompt Tuning for Multi-Label Text Classification: How to Link Exercises to Knowledge Concept

2023-10-27 115 发布于辽宁

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 文章这里使用的是BCEWithLogitsLoss，它适用于多标签分类。即：把[MASK]位置预测到的词表的值进行sigmoid，取指定阈值以上的标签，然后算损失。

阅读摘要

如上图，思路很朴实无华。

普通MLM任务使用的损失函数是CrossEntropyLoss，它适用于单标签，代码如下：

masked_lm_loss = None
        if labels is not None:
            loss_fct = CrossEntropyLoss()  # -100 index = padding token
            masked_lm_loss = loss_fct(prediction_scores.view(-1, self.config.vocab_size), labels.view(-1))

文章这里使用的是BCEWithLogitsLoss，它适用于多标签分类。即：把[MASK]位置预测到的词表的值进行sigmoid，取指定阈值以上的标签，然后算损失。

个人觉得这样不可取，效果也不会好。

文章标签：

数据挖掘

征途黯然。

+关注

目录

打赏

0

0

0

0

176

相关文章

征途黯然。

|

机器学习/深度学习数据挖掘

【提示学习】HPT: Hierarchy-aware Prompt Tuning for Hierarchical Text Classification

本文是较早把Prompt应用到层级多标签文本分类领域的论文。思路是把层级标签分层编入到Pattern中，然后修改损失函数以适应多标签的分类任务。

征途黯然。

288 0 0

征途黯然。

|

数据挖掘

【提示学习】Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification

文章提出了一种简单确高效地构建verbalization的方法：

征途黯然。

93 0 0

Trouble..

|

自然语言处理算法

SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model

在社交媒体上，面临着大量的知识和信息，一个有效的关键词抽取算法可以广泛地被应用的信息检索和自然语言处理中。传统的关键词抽取算法很难使用外部的知识信息。

Trouble..

186 0 0

SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model

Trouble..

|

自然语言处理算法 vr&ar

X-GEAR:Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction

我们提出了一项利用多语言预训练生成语言模型进行零样本跨语言事件论元抽取(EAE)的研究。通过将EAE定义为语言生成任务，我们的方法有效地编码事件结构并捕获论元之间的依赖关系。

Trouble..

175 0 0

征途黯然。

|

自然语言处理数据挖掘数据处理

【提示学习】Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

目前流行的第四大范式Prompt的主流思路是PVP，即Pattern-Verbalizer-Pair，主打的就是Pattern(模板)与Verbalizer(标签映射器)。本文基于PVP，提出PET与iPET，但是关注点在利用半监督扩充自己的数据集，让最终模型学习很多样本，从而达到好效果。

征途黯然。

153 0 1

Trouble..

|

机器学习/深度学习自然语言处理索引

GTEE-DYNPREF: Dynamic Prefix-Tuning for Generative Template-based Event Extraction 论文解读

我们以基于模板的条件生成的生成方式考虑事件抽取。尽管将事件抽取任务转换为带有提示的序列生成问题的趋势正在上升，但这些基于生成的方法存在两个重大挑战

Trouble..

174 0 0

Trouble..

|

自然语言处理算法知识图谱

DEGREE: A Data-Efficient Generation-Based Event Extraction Model论文解读

事件抽取需要专家进行高质量的人工标注，这通常很昂贵。因此，学习一个仅用少数标记示例就能训练的数据高效事件抽取模型已成为一个至关重要的挑战。

Trouble..

209 0 0

Trouble..

|

机器学习/深度学习自然语言处理算法

Multimedia Event Extraction From News With a Unified Contrastive Learning Framework论文解读

从新闻中提取事件在下游应用程序中有很多好处。然而，今天的事件提取（EE）系统通常专注于单一的模态——无论是文本还是图像

Trouble..

213 0 0

Trouble..

|

自然语言处理算法

【论文精读】COLING 2022 - CLIO: Role-interactive Multi-event Head Attention Network for DEE

将网络上的大量非结构化文本转换为结构化事件知识是NLP的一个关键但尚未解决的目标，特别是在处理文档级文本时。

Trouble..

88 0 0

北村南

|

数据可视化数据挖掘

【论文解读】Dual Contrastive Learning：Text Classification via Label-Aware Data Augmentation

北航出了一篇比较有意思的文章，使用标签感知的数据增强方式，将对比学习放置在有监督的环境中，下游任务为多类文本分类，在低资源环境中进行实验取得了不错的效果

北村南

551 0 0

热门文章

最新文章

免费IDM下载器序列号2023Internet Download Manager许可证

错误”ORA-12560: TNS: 协议适配器错误“解决方法

边缘计算系统逻辑架构：云、边、端协同，定义及关系

Mac 上 iterm2 和 VSCode 终端中的字体设置建议

信用算力基于 RocketMQ 实现金融级数据服务的实践

不了解 QPS、TPS、RT、并发数、吞吐量，劝你简历别写熟悉高并发

MVC 树节点Table格式授权

Async/Await是这样简化JavaScript代码的

详细分析Java中断机制（转）

【ZT】新东方10天背5500词汇经典讲座

基于生物地理算法的MLP多层感知机优化matlab仿真

算法系列之广度优先搜索解决妖怪和尚过河问题

【硬件测试】基于FPGA的4ASK调制解调通信系统开发与硬件片内测试,包含信道模块,误码统计模块,可设置SNR

【03】微信支付商户申请下户到配置完整流程-微信开放平台创建APP应用-填写上传基础资料-生成安卓证书-获取Apk签名-申请+配置完整流程-优雅草卓伊凡

基于MobileNet深度学习网络的MQAM调制类型识别matlab仿真

Redis应用—9.简单应用汇总

关于阿里云无影云电脑的“核时”计算公式及40核时、80核时、160核时、320核时使用时间说明

《从2.3倍增速剖析：DeepSeek隐层表征对齐技术的创新密码》

《DeepSeek“数据消化片”：数据合规困境的破局之道》

《DeepSeek“知识精炼重生”：人工智能时代的知识进化密码》

相关电子书

更多

Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition

Text Classifier Algorithms in

Big Data-Based Fraud Detection

下一篇

阿里云负载均衡SLB版本CLB、ALB和NLB有什么区别如何选择？

目录

阅读摘要

目录

你好，我是AI助理

可以解答问题、推荐解决方案等