PubMedBERT:生物医学自然语言处理领域的特定预训练模型

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: 今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta,这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中,大语言模型并不一定就是最优的解决方案,“小”模型也有一定的用武之地,所以今天我们来介绍PubMedBERT,它使用特定领域语料库从头开始预训练BERT,这是微软研究院2022年发布在ACM的论文。

论文的主要要点如下:

对于具有大量未标记文本的特定领域,如生物医学,从头开始预训练语言模型比持续预训练通用领域语言模型效果显著。提出了生物医学语言理解与推理基准(BLURB)用于特定领域的预训练。

PubMedBERT

1、特定领域Pretraining

研究表明,从头开始的特定领域预训练大大优于通用语言模型的持续预训练,从而表明支持混合领域预训练的主流假设并不总是适用。

2、模型

使用BERT。对于掩码语言模型(MLM),全词屏蔽(WWM)强制要求整个词必须被屏蔽。

3、BLURB数据集

据作者介绍,BLUE[45]是在生物医学领域创建NLP基准的第一次尝试。但BLUE的覆盖范围有限。针对基于pubmed的生物医学应用,作者提出了生物医学语言理解与推理基准(BLURB)。

PubMedBERT使用更大的特定领域语料库(21GB)。

结果展示

在大多数生物医学NLP任务中,PubMedBERT始终优于所有其他BERT模型,并且通常具有显著的优势。

论文地址:

https://dl.acm.org/doi/10.1145/3458754

作者:Sik-Ho Tsang

目录
相关文章
|
4月前
|
机器学习/深度学习 自然语言处理 数据格式
训练你自己的自然语言处理深度学习模型,Bert预训练模型下游任务训练:情感二分类
训练你自己的自然语言处理深度学习模型,Bert预训练模型下游任务训练:情感二分类
55 0
|
5月前
|
机器学习/深度学习 自然语言处理 算法
19ContraBERT:顶会ICSE23 数据增强+对比学习+代码预训练模型,提升NLP模型性能与鲁棒性:处理程序变异(变量重命名)【网安AIGC专题11.15】
19ContraBERT:顶会ICSE23 数据增强+对比学习+代码预训练模型,提升NLP模型性能与鲁棒性:处理程序变异(变量重命名)【网安AIGC专题11.15】
84 1
|
11月前
|
机器学习/深度学习 人工智能 移动开发
人工智能领域:面试常见问题超全(深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩、强化学习、元学习)
人工智能领域:面试常见问题超全(深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩、强化学习、元学习)
|
机器学习/深度学习 自然语言处理 搜索推荐
NLP领域任务如何选择合适预训练模型以及选择合适的方案【规范建议】
4.NLP领域任务如何选择合适预训练模型以及选择合适的方案【规范建议】
|
机器学习/深度学习 人工智能 自然语言处理
预约直播 | 基于预训练模型的自然语言处理及EasyNLP算法框架
阿里云AI技术分享会第三期《基于预训练模型的自然语言处理及EasyNLP算法框架》将在2022年08月24日晚18:00-18:30直播,精彩不容错过!
|
自然语言处理 机器人 Java
自然语言处理预训练模型招标中标信息抽取-高级版服务 Quick Start
自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好的效果。可用于搭建内容搜索、内容推荐、舆情识别及分析、文本结构化、对话机器人等智能产品。NLP自学习平台提供了一些预训练的特定领域模型服务。例如:商品评价解析服务、新闻层次分类服务、中文简历抽取、英文简历抽取等,且无需自主标注训练,直接调用API即可使用。本文将使用Java SDK演示招标中标信息抽取-高级版服务的快速调用以供参考。
413 0
|
自然语言处理 机器人 Java
自然语言处理预训练模型招中标公告类型分类服务 Quick Start
自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好效果。可用于搭建内容搜索、内容推荐、舆情识别分析、对话机器人等智能产品。NLP自学习平台提供了一些预训练的特定领域模型服务。服务无需自主标注训练,直接调用API即可使用。招中标公告类型分类服务适用于作为招标解析服务(高级版)、中标解析服务(高级版)的前处理步骤。本文将使用Java SDK演示招中标公告类型分类服务的快速调用,以供参考。
194 0
|
自然语言处理 Java API
自然语言处理预训练模型在线客服场景客户咨询解析 Quick Start
自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好的效果。NLP自学习平台提供了一些预训练的特定领域模型服务。服务无需自主标注训练,直接调用API即可使用。在线客服场景客户咨询解析服务适用于针对电商等行业的客服-消费者在线聊天场景,解析消费者说话内容,得到消费者意图、情感、情绪、关注点、细粒度情感等结果。本文将使用Java SDK演示在线客服场景客户咨询解析服务的快速调用,以供参考。
258 0
|
机器学习/深度学习 人工智能 自然语言处理
从BERT、XLNet到MPNet,细看NLP预训练模型发展变迁史
从BERT、XLNet到MPNet,细看NLP预训练模型发展变迁史
|
自然语言处理 Java 机器人
自然语言处理预训练模型商品评价解析服务-本地生活领域 Java SDK示例
自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好的效果。可用于搭建内容搜索、内容推荐、舆情识别及分析、文本结构化、对话机器人等智能产品。NLP自学习平台提供了一些预训练的特定领域模型服务。例如:商品评价解析服务、新闻层次分类服务、中文简历抽取、英文简历抽取等,且无需自主标注训练,直接调用API即可使用。本文将使用Java SDK演示商品评价解析服务-本地生活领域的快速调用以供参考。
194 0