备案控制台登录注册

开发者社区人工智能文章正文

关于为什么有了通用BERT，却还需要特定领域BERT？-对此问题做出回答的相关理论和文章（如有）（持续更新ing...）

2022-10-23 192 发布于内蒙古

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 关于为什么有了通用BERT，却还需要特定领域BERT？-对此问题做出回答的相关理论和文章（如有）（持续更新ing...）

1. 空间论

不同类型的语料所覆盖的空间会不一样，训练出来的模型理论上应该是对训练集所覆盖的空间的测试集的泛化效果更好，而如果你用的是特定语料的bert，但是你想测试其他领域的余料的话，它的泛化性就会弱。

2. 知识论

预训练语言模型能学习到语料中的知识，而通用语料缺乏特定领域的知识，因此直接用通用BERT难以解决需要专业知识的特定领域的问题。

（可以参考：LawBERT: Towards a Legal Domain-Specific BERT? | by Erin Zhang | Towards Data Science）

3. 典型的特定领域BERT

生物医学：BioBERT

科学出版物：SciBERT

金融：FinBERT

医学：ClinicalBERT

法律：LegalBERT

文章标签：

自然语言处理

诸神缄默不语

+关注

目录

打赏

0

0

0

0

20

相关文章

游客iigf2m33ba53k

|

机器学习/深度学习人工智能自然语言处理

一文尽览 | 开放世界目标检测的近期工作及简析！（基于Captioning/CLIP/伪标签/Prompt）（上）

人类通过自然监督，即探索视觉世界和倾听他人描述情况，学会了毫不费力地识别和定位物体。我们人类对视觉模式的终身学习，并将其与口语词汇联系起来，从而形成了丰富的视觉和语义词汇，不仅可以用于检测物体，还可以用于其他任务，如描述物体和推理其属性和可见性。人类的这种学习模式为我们实现开放世界的目标检测提供了一个可以学习的角度。

游客iigf2m33ba53k

1507 0 0

一文尽览 | 开放世界目标检测的近期工作及简析！（基于Captioning/CLIP/伪标签/Prompt）（上）

诸神缄默不语

|

机器学习/深度学习自然语言处理算法

文本摘要（text summarization）任务：研究范式，重要模型，评估指标（持续更新ing...）

本文是作者在学习文本摘要任务的过程中，根据学习资料总结逐步得到并整理为成文的相关内容。相关学习资料（包括论文、博文、视频等）都会以脚注等形式标明。有一些在一篇内会导致篇幅过长的内容会延伸到其他博文中撰写，但会在本文中提供超链接。本文将主要列举里程碑式的重要文本摘要论文。注意：除文首的表格外，本文所参考的论文，如本人已撰写对应的学习博文，则不直接引用原论文，而引用我撰写的博文。本文会长期更新。

诸神缄默不语

1361 0 0

文本摘要（text summarization）任务：研究范式，重要模型，评估指标（持续更新ing...）

bruce_xiaowei

|

4月前

|

Java

ChatGPT高效提问—prompt常见用法（续篇十二）

ChatGPT高效提问—prompt常见用法（续篇十二）

bruce_xiaowei

74 1 1

番茄酱脑袋

|

6月前

|

机器学习/深度学习

Sora 原理使用问题之Sora提示词的语义并进行视频生成该如何理解

Sora 原理使用问题之Sora提示词的语义并进行视频生成该如何理解

番茄酱脑袋

59 1 1

热烈的马

|

9月前

|

自然语言处理 Python

BERT模型基本理念、工作原理、配置讲解（图文解释）

BERT模型基本理念、工作原理、配置讲解（图文解释）

热烈的马

1070 0 0

-开发达人-

|

机器学习/深度学习数据采集人工智能

Meta这篇语言互译大模型研究，结果对比都是「套路」

Meta这篇语言互译大模型研究，结果对比都是「套路」

-开发达人-

449 0 0

汀丶人工智能

|

人工智能自然语言处理机器人

Prompt工程师指南从基础到进阶篇：用于开发和优化提示，以有效地使用语言模型（LMs）进行各种应用和研究主题

Prompt工程师指南从基础到进阶篇：用于开发和优化提示，以有效地使用语言模型（LMs）进行各种应用和研究主题

汀丶人工智能

611 0 0

-开发达人-

|

机器学习/深度学习自然语言处理算法

清北微软深挖GPT，把上下文学习整明白了！和微调基本一致，只是参数没变而已

清北微软深挖GPT，把上下文学习整明白了！和微调基本一致，只是参数没变而已

-开发达人-

215 0 0

-开发达人-

|

机器学习/深度学习人工智能自然语言处理

ChatGPT背后的指令学习是什么？PSU发布首篇「指令学习」全面综述

ChatGPT背后的指令学习是什么？PSU发布首篇「指令学习」全面综述

-开发达人-

219 0 0

-开发达人-

|

机器学习/深度学习并行计算算法

像Transformer一样思考！DeepMind发布全新模型设计工具Tracr：从可解释逻辑反向搭建模型

像Transformer一样思考！DeepMind发布全新模型设计工具Tracr：从可解释逻辑反向搭建模型

-开发达人-

211 0 0

热门文章

最新文章

6亿数据秒级查询，ClickHouse太快了！

Unsafe工具类 | 带你学《Java语言高级特性》之八十八

用模拟器加载基于ARM平台的WinCE6.0 内核（NK.bin）

Windows新0day漏洞可穿透UAC

Java 多线程之 Runnable

微信将整顿多级分销欺诈行为严重者将永久封号

独家 | Face++印奇：AI是场持久战，但第一阶段明年结束

给文档库添加项目级权限控制

python中if __name__ == '__main__': 的解析

《UNIX网络编程》中第一个timer_server的例子

Dpkg软件包管理工具使用指南

RPM软件包管理工具使用指南

Apt软件包管理工具使用指南

Yum与Dnf软件包管理器使用指南

图解MySQL【日志】——Redo Log

Linux软件包管理工具概览

基于扩频解扩+turbo译码的16QAM图传通信系统matlab误码率仿真,扩频参数可设置

通过MATLAB实现PID控制器,积分分离控制器以及滑模控制器

基于Itô扩散过程的交易策略偏微分方程matlab求解与仿真

draw.io：开源款白板/图表绘制利器

相关课程

更多

机器学习入门-概念原理及常用算法

AIGC文生图训练营（从理论到实践）

机器阅读技术与应用

深度学习理论与实战（基于TensorFlow实现）

深度学习原理与实践

模型瘦身秘籍：模型压缩技术

相关电子书

更多

典型模型-卷积神经网络入门从概念原理到应用实现

视频内容理解的研究与实践

如何成为一名优秀的工程师(语义篇）

相关实验场景

更多

基于百炼构建可以划重点、规划学习计划的学习助手

【自由换模型】基于函数计算一键部署 Stable Diffusion

使用PAI-快速开始，低代码实现大语言模型微调和部署

实验手册指导文档

下一篇

阿里云oss简介和如何对接使用

目录

目录

你好，我是AI助理

可以解答问题、推荐解决方案等