备案控制台

开发者社区人工智能文章正文

Re26：读论文 Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks

2022-10-23 162

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Re26：读论文 Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks

1. Background & Motivation

本文想要证明：任务的textual domain仍然有效。

现存工作大多仅在一个领域、用多样性比预训练模型更弱的语料微调一次，而连续预训练的优势是否与可获得有标签任务数据、目标域和原始预训练语料域的相似性等元素有关，扔待探究。

本文主要研究RoBERTa在非预训练语料域上的分类任务表现在连续预训练之下的影响。

2. DAPT

2.1 数据集和实验

baseline：直接在每个分类任务上finetune

2.2 分析域相似性

在海量的域测试集文本上一万个最常见的unigram（去掉停用词）

DAPT在不相似域上潜力更大。

3. TAPT

跨域DAPT+TAPT灾难性遗忘问题（说明了通用预训练模型的不足，DAPT和TAPT的必要性）：

三阶段预训练：

4. TAPT训练集数据增强

用human-curated corpus中抽取的大量无标签数据
在没有human-curated corpus的任务下，检索无标签领域语料中的TAPT相关数据

VAMPIRE：轻量BOW语言模型

5. 参考文献

同一任务训练集和测试集分布的domain shift

其他细节略。

6. 代码复现

我觉得这个代码我复现不了……太金钱游戏了……

文章标签：

自然语言处理

诸神缄默不语

目录

相关文章

皮卡丘敲级可爱

|

机器学习/深度学习编解码人工智能

Reading Notes： Human-Computer Interaction System: A Survey of Talking-Head Generation

由于人工智能的快速发展，虚拟人被广泛应用于各种行业，包括个人辅助、智能客户服务和在线教育。拟人化的数字人可以快速与人接触，并在人机交互中增强用户体验。因此，我们设计了人机交互系统框架，包括语音识别、文本到语音、对话系统和虚拟人生成。接下来，我们通过虚拟人深度生成框架对Talking-Head Generation视频生成模型进行了分类。同时，我们系统地回顾了过去五年来在有声头部视频生成方面的技术进步和趋势，强调了关键工作并总结了数据集。对于有关于Talking-Head Generation的方法，这是一篇比较好的综述，我想着整理一下里面比较重要的部分，大概了解近几年对虚拟人工作的一些发展和

皮卡丘敲级可爱

2344 0 2

征途黯然。

|

8月前

|

存储自然语言处理数据可视化

【提示学习】AUTOPROMPT: Eliciting Knowledge from Language Models with Automatically Generated Prompts

Prompt任务需要构建合适的Pattern，但是编写合适的Pattern需要手动工作和人为猜测，有很大的不确定性。为了解决这个问题，提出AUTOPROMPT模型，基于梯度下降搜索来创建Pattern。

征途黯然。

57 0 0

征途黯然。

|

8月前

|

数据挖掘

【提示学习】Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification

文章提出了一种简单确高效地构建verbalization的方法：

征途黯然。

22 0 0

征途黯然。

|

8月前

|

数据挖掘

【提示学习】Prompt Tuning for Multi-Label Text Classification: How to Link Exercises to Knowledge Concept

文章这里使用的是BCEWithLogitsLoss，它适用于多标签分类。即：把[MASK]位置预测到的词表的值进行sigmoid，取指定阈值以上的标签，然后算损失。

征途黯然。

41 0 0

Trouble..

|

10月前

|

机器学习/深度学习存储数据采集

DCFEE： A Document-level Chinese Financial Event Extraction System based on Automatically Labeled论文解读

我们提出了一个事件抽取框架，目的是从文档级财经新闻中抽取事件和事件提及。到目前为止，基于监督学习范式的方法在公共数据集中获得了最高的性能（如ACE 2005、KBP 2015）。这些方法严重依赖于人工标注的训练数据。

Trouble..

77 0 0

Trouble..

|

10月前

|

机器学习/深度学习自然语言处理索引

GTEE-DYNPREF: Dynamic Prefix-Tuning for Generative Template-based Event Extraction 论文解读

我们以基于模板的条件生成的生成方式考虑事件抽取。尽管将事件抽取任务转换为带有提示的序列生成问题的趋势正在上升，但这些基于生成的方法存在两个重大挑战

Trouble..

85 0 0

Trouble..

|

10月前

|

机器学习/深度学习自然语言处理算法

RCEE: Event Extraction as Machine Reading Comprehension 论文解读

事件提取(Event extraction, EE)是一项重要的信息提取任务，旨在提取文本中的事件信息。以前的EE方法通常将其建模为分类任务，这些任务需要大量数据，并且存在数据稀缺问题。在本文中，我们提出了一种新的EE学习范式，将其明确地转换为机器阅读理解问题(MRC)。

Trouble..

163 0 0

Trouble..

|

10月前

|

数据挖掘

MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts 论文解读

事件检测（ED）从非结构化文本中识别和分类事件触发词，作为信息抽取的基本任务。尽管在过去几年中取得了显著进展

Trouble..

46 0 0

Trouble..

|

10月前

|

机器学习/深度学习自然语言处理算法

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking 论文解读

近年来，从非结构化文本中提取实体和关系引起了越来越多的关注，但由于识别共享实体的重叠关系存在内在困难，因此仍然具有挑战性。先前的研究表明，联合学习可以显著提高性能。然而，它们通常涉及连续的相互关联的步骤，并存在暴露偏差的问题。

Trouble..

133 0 0

183王德发

|

自然语言处理

Reading the Manual: Event Extraction as Definition Comprehension, EMNLP 2020

Reading the Manual: Event Extraction as Definition Comprehension, EMNLP 2020

183王德发

69 0 0

Reading the Manual: Event Extraction as Definition Comprehension, EMNLP 2020

热门文章

最新文章

优酷中后台前端解决方案－总览

流计算风云再起 - PostgreSQL携PipelineDB力挺IoT(物联网), 大幅提升性能和开发效率

PyODPS 安装常见问题解决

读取excel文件后计算指定行列笛卡儿积并写出

Hibernate 里一些常用操作

10.2-10.3 datetime与时间格式的相互转换

Netty重要概念介绍

联想确认再次裁员称调整主要分布在海外

阿里2016财报：强调正全力发展云计算等为四大业务

STL - 常用关联容器代码 - set & multiset

基于SpringBoot+Vue+uniapp的民宿预订系统的详细设计和实现(源码+lw+部署文档+讲解等)

《500 Lines or Less》（13）—— A 3D Modeller

基于SpringBoot+Vue+uniapp的电子书阅读器系统的详细设计和实现(源码+lw+部署文档+讲解等)

基于SpringBoot+Vue的母婴全程服务管理系统的详细设计和实现(源码+lw+部署文档+讲解等)

基于SpringBoot+Vue的招投标管理系统的详细设计和实现(源码+lw+部署文档+讲解等)

基于SpringBoot+Vue的失物招领系统的详细设计和实现(源码+lw+部署文档+讲解等)

基于SpringBoot+Vue的高校科研信息管理系统的详细设计和实现(源码+lw+部署文档+讲解等)

基于SpringBoot+Vue+uniapp的电影信息推荐APP的详细设计和实现

基于SpringBoot+Vue+uniapp的课程考勤及作业提交App的详细设计和实现

基于SpringBoot+Vue+uniapp的宠物饲养管理APP的详细设计和实现

相关电子书

更多

The Leaky Pipeline Problem: Making your Mark as a Woman in Big Data

Fighting Cybercrime: A Joint Task Force of Real-Time Data and Human Analytics

From Pipelines to Refineries:Scaling Big Data Applications

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考