五分钟带你了解ChatGPT的基本原理

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 五分钟带你了解ChatGPT的基本原理

image.png

What is LLM?

LLM是大型语言模型Large Language Model的缩写,跟LLM相关的另外一个概念是NLP(Natural Language Processing自然语言处理技术的一种 )。

Nautual Language: 指的是自然形成的语言,诸如Chinese, English, etc...

NLP:指的是对自然语言的结构进行分析,对语句进行理解、解析,并对内容进行生成的技术

LLM核心原理是根据前文推算出下一个可能发生的字的模型

LLM技术其实应用已经非常广泛,比如手机输入法会预测你下一个要打的字,这也是LLM的一种

image.png

(输入法根据你输入的“今晚”,会推测你究竟是要去夜尿还是夜宵,这就是LLM的应用的一种)

What is GPT?

基本原理

与LLM不同的是,LLM只通过你输入的前一个字或者前一个词语,推测你下一个字是什么。而GPT则是通过你输入的整个句子,来推测下一个字

所以,GPT核心原理根据前面输入的语句,推测下一个字是什么

image.png

(根据“披萨”,“配料”,“是”等关键字,可以推测会与下面这些字大概率有联系。图片截取于泛科技的视频内容)

GPT的另外一个特点是有一定的随机性,因为像上面的例子那样,推测的各个字都是有一定的概率的。这就是为什么你去问ChatGPT同一个问题,有时候会得到不同的答案的原因。

基本原理是根据前面输入,推测下面是什么。那么GPT究竟是根据什么来推测的呢?这就不得不说一下他学习知识(经验)的过程。

模型生成的过程

GPT模型的生成过程核心是先通过无标签的文本去训练(无监督学习)生成语言模型,再根据具体的NLP任务(如文本蕴涵、QA、文本分类等),来通过有标签的数据对模型进行fine-tuning微调(有监督学习)

image.png

看电视使我们掌握了很多语言的知识,有英语的,有中文的,也有网络用语,也有人与自然的知识。但是我们往往无法理解这些语言在说什么,或者说哪些观点是正确的。这个时候就需要老师给你讲道理和知识,告诉你这句话是什么意思,告诉你哪些价值观是正确or错误的。这个过程跟GPT模型生成的过程就非常类似,先无序地大量看电视,再通过老师的讲解,明辨是非。

量变到质变

image.png

随着数据集的增大,我们发现当无监督学习的数据量增大到一定到程度,有监督学习就算变少也不会影响模型效果。到了GPT-3,当参数到达了1750亿以后,更是突然出现了诸如思维链等特性

image.png

如果把无监督学习比作看电视,把有监督学习比作老师上课。我们以前以为要多听老师上课,少看电视,才能有正确的知识。但是我们发现,当看的电视足够多的时候,我们可以自动地识别出正确的知识,甚至产生思维链。所以说小时候家长跟我们说少看电视多读书,其实是不对的,恰恰是因为我们电视看得太少了,如果看的电视有GPT-3那么多,那就全知全能了。

What is ChatGPT?

ChatGPT = GPT-3.5 + 人类交互行为的强化学习

ChatGPT是基于GPT-3.5的基础上,叠加人类交互行为的强化的学习训练出来的人工智能聊天机器人。换句话说就是叠加了一些训练,使得ChatGPT看起来更像一个真实的人,跟他聊天就像跟一个真实的人在聊天一样。

image.png

Refer:

https://pansci.asia/ 泛科学

相关文章
|
6月前
|
人工智能 自然语言处理 搜索推荐
揭秘ChatGPT的Prompt方法:原理与应用总结
揭秘ChatGPT的Prompt方法:原理与应用总结
|
存储 编译器 Go
结合ChatGPT辅助学习Go语言底层原理
在当今的信息时代,编程语言已经成为了科技领域的基础工具之一。其中,Go语言以其简洁、高效和并发性强等优点,在开发者中赢得了广泛的好评。然而,对于初学者或是想要深入理解Go语言底层原理的人来说,直接阅读和理解其源码可能会面临一定困难。我主要从以下几个方面分享一些使用ChatGPT辅助学习Go语言底层源码的小技巧。
248 0
结合ChatGPT辅助学习Go语言底层原理
|
机器学习/深度学习 人工智能 算法
人工智能原理概述 - ChatGPT 背后的故事1
一、人工智能历史 二、机器学习 2.1 预测函数 2.2 代价函数 2.3 梯度计算
|
1月前
|
自然语言处理
从原理上总结chatGPT的Prompt的方法
从原理上总结chatGPT的Prompt的方法
32 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI大模型】ChatGPT模型原理介绍(下)
【AI大模型】ChatGPT模型原理介绍(下)
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI大模型】ChatGPT模型原理介绍(上)
【AI大模型】ChatGPT模型原理介绍(上)
|
2月前
|
存储 安全 机器人
autofs - 工作原理 【ChatGPT】
autofs - 工作原理 【ChatGPT】
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】深度解读 ChatGPT基本原理
ChatGPT是OpenAI开发的一种基于人工智能技术的自然语言处理工具,它代表了自然语言处理(NLP)技术的前沿进展。ChatGPT的基本原理建立在一系列先进技术和方法之上,主要包括GPT(Generative Pre-trained Transformer)模型架构、预训练与微调技术、以及可能采用的RLHF(Reinforcement Learning from Human Feedback)等高级训练策略。下面将详细解读ChatGPT的基本原理和关键技术:
85 1
|
4月前
|
存储 机器学习/深度学习 人工智能
一文读懂ChatGPT的工作原理
【7月更文挑战第24天】.一文读懂ChatGPT的工作原理
130 2
|
6月前
|
机器学习/深度学习 存储 自然语言处理
ChatGPT原理分析
ChatGPT原理分析
49 1