语言模型

简介: 语言模型

语言模型


语言模型(Language Model)通过对句子的上下文特征进行数学建模,来回答一个问题:出现的句子是否合理。


语言模型是自然语言的基础,广泛应用于机器翻译、语音识别、拼写纠错、输入法、手写体识别等。


对于一个由单词构成的句子s = w 1 w 2 .w n,其概率计算公式:


image.png

在统计语言模型中,一般采用极大似然来计算每个词出现的条件概率:


image.png


假设词汇集的大小为L ,对于一个长度为n 的句子进行建模,则需要计算ln个参数。假设L = 5000 , n = 3则参数个数就是1250亿个。


为解决参数空间过大的问题,引入了马尔可夫假设,即第N 个词出现的概率只与前面出现的N − 1 个词有关,称为n-gram。


n = 1 ,一元模型(unigram),即每个词之间都是相互独立的:


image.png


n=2,二元模型(bigram)


image.png

n=3,三元模型(trigram)


image.png

相关文章
|
1月前
|
机器学习/深度学习 自然语言处理 算法
预训练语言模型是什么?
【2月更文挑战第13天】预训练语言模型是什么?
22 2
预训练语言模型是什么?
|
7月前
|
机器学习/深度学习 自然语言处理 算法
大型语言模型:SBERT — 句子BERT
大型语言模型:SBERT — 句子BERT
89 0
|
23天前
|
机器学习/深度学习 自然语言处理
|
1月前
|
自然语言处理 搜索推荐 物联网
LLM技術的引領
LLM技術的引領在LLM(大型语言模型)技术的引领下,中国智慧家电将迎来一系列创新性的新功能。这些功能不仅将提升家电的智能化水平,还将为用户带来更加便捷、高效和个性化的使用体验。
17 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
大语言模型LLM中的幻觉
大语言模型LLM中的幻觉
137 0
|
4月前
|
机器学习/深度学习 自然语言处理 Linux
稀疏微调:彻底改变大语言模型的推理速度
稀疏微调:彻底改变大语言模型的推理速度
116 0
|
11月前
|
自然语言处理 物联网 算法框架/工具
开源大语言模型(LLM)汇总
随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。
2668 0
开源大语言模型(LLM)汇总
|
9月前
|
机器学习/深度学习 测试技术
LLM-Blender:大语言模型也可以进行集成学习
最近在看arxiv的时候发现了一个有意思的框架:LLM-Blender,它可以使用Ensemble 的方法来对大语言模型进行集成。
162 0
|
9月前
|
机器学习/深度学习 自然语言处理 数据可视化
微调预训练的 NLP 模型
微调预训练的 NLP 模型
119 1
|
11月前
|
机器学习/深度学习 数据采集 人工智能
一篇介绍这个"风靡的语言模型的文章"
OpenAI 近期发布聊天机器人模型 ChatGPT,迅速出圈全网。它以对话方式进行交互。以更贴近人的对话方式与使用者互动,可以回答问题、承认错误、挑战不正确的前提、拒绝不适当的请求。高质量的回答、上瘾式的交互体验,圈内外都纷纷惊呼。