五分钟带你了解ChatGPT的基本原理

简介: 五分钟带你了解ChatGPT的基本原理

image.png

What is LLM?

LLM是大型语言模型Large Language Model的缩写,跟LLM相关的另外一个概念是NLP(Natural Language Processing自然语言处理技术的一种 )。

Nautual Language: 指的是自然形成的语言,诸如Chinese, English, etc...

NLP:指的是对自然语言的结构进行分析,对语句进行理解、解析,并对内容进行生成的技术

LLM核心原理是根据前文推算出下一个可能发生的字的模型

LLM技术其实应用已经非常广泛,比如手机输入法会预测你下一个要打的字,这也是LLM的一种

image.png

(输入法根据你输入的“今晚”,会推测你究竟是要去夜尿还是夜宵,这就是LLM的应用的一种)

What is GPT?

基本原理

与LLM不同的是,LLM只通过你输入的前一个字或者前一个词语,推测你下一个字是什么。而GPT则是通过你输入的整个句子,来推测下一个字

所以,GPT核心原理根据前面输入的语句,推测下一个字是什么

image.png

(根据“披萨”,“配料”,“是”等关键字,可以推测会与下面这些字大概率有联系。图片截取于泛科技的视频内容)

GPT的另外一个特点是有一定的随机性,因为像上面的例子那样,推测的各个字都是有一定的概率的。这就是为什么你去问ChatGPT同一个问题,有时候会得到不同的答案的原因。

基本原理是根据前面输入,推测下面是什么。那么GPT究竟是根据什么来推测的呢?这就不得不说一下他学习知识(经验)的过程。

模型生成的过程

GPT模型的生成过程核心是先通过无标签的文本去训练(无监督学习)生成语言模型,再根据具体的NLP任务(如文本蕴涵、QA、文本分类等),来通过有标签的数据对模型进行fine-tuning微调(有监督学习)

image.png

看电视使我们掌握了很多语言的知识,有英语的,有中文的,也有网络用语,也有人与自然的知识。但是我们往往无法理解这些语言在说什么,或者说哪些观点是正确的。这个时候就需要老师给你讲道理和知识,告诉你这句话是什么意思,告诉你哪些价值观是正确or错误的。这个过程跟GPT模型生成的过程就非常类似,先无序地大量看电视,再通过老师的讲解,明辨是非。

量变到质变

image.png

随着数据集的增大,我们发现当无监督学习的数据量增大到一定到程度,有监督学习就算变少也不会影响模型效果。到了GPT-3,当参数到达了1750亿以后,更是突然出现了诸如思维链等特性

image.png

如果把无监督学习比作看电视,把有监督学习比作老师上课。我们以前以为要多听老师上课,少看电视,才能有正确的知识。但是我们发现,当看的电视足够多的时候,我们可以自动地识别出正确的知识,甚至产生思维链。所以说小时候家长跟我们说少看电视多读书,其实是不对的,恰恰是因为我们电视看得太少了,如果看的电视有GPT-3那么多,那就全知全能了。

What is ChatGPT?

ChatGPT = GPT-3.5 + 人类交互行为的强化学习

ChatGPT是基于GPT-3.5的基础上,叠加人类交互行为的强化的学习训练出来的人工智能聊天机器人。换句话说就是叠加了一些训练,使得ChatGPT看起来更像一个真实的人,跟他聊天就像跟一个真实的人在聊天一样。

image.png

Refer:

https://pansci.asia/ 泛科学

相关文章
|
21天前
|
人工智能 自然语言处理 搜索推荐
揭秘ChatGPT的Prompt方法:原理与应用总结
揭秘ChatGPT的Prompt方法:原理与应用总结
65 0
|
7月前
|
机器学习/深度学习 人工智能 算法
人工智能原理概述 - ChatGPT 背后的故事1
一、人工智能历史 二、机器学习 2.1 预测函数 2.2 代价函数 2.3 梯度计算
|
8月前
|
存储 编译器 Go
结合ChatGPT辅助学习Go语言底层原理
在当今的信息时代,编程语言已经成为了科技领域的基础工具之一。其中,Go语言以其简洁、高效和并发性强等优点,在开发者中赢得了广泛的好评。然而,对于初学者或是想要深入理解Go语言底层原理的人来说,直接阅读和理解其源码可能会面临一定困难。我主要从以下几个方面分享一些使用ChatGPT辅助学习Go语言底层源码的小技巧。
207 0
结合ChatGPT辅助学习Go语言底层原理
|
21天前
|
机器学习/深度学习 存储 自然语言处理
ChatGPT原理分析
ChatGPT原理分析
17 1
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
技术小白能看懂的ChatGPT原理介绍
网上有关 ChatGPT 的原理介绍文章一大堆,要么是从 NLP 的历史开始讲起,要么是上数 GPT 3 代,内容都相对冗长和复杂。其实 ChatGPT 的原理并不难理解,我将以最通俗易懂的方式为技术小白解读,帮助大家更好地了解这一技术
520 1
技术小白能看懂的ChatGPT原理介绍
|
21天前
|
存储 人工智能
ChatGPT的基本原理认识
很多东西很难用文字完全表述,比如如何形容一朵花都感觉不够完美,最简单方法就是把照片拿出来看。而多模态的ChatGPT就做的事这件事,接收:类型的输入并且输出各种类型的输出。
53 1
|
21天前
|
机器学习/深度学习 数据采集 人工智能
chatgpt生成文本的底层工作原理是什么?
chatgpt生成文本的底层工作原理是什么?
|
7月前
|
机器学习/深度学习 人工智能 搜索推荐
软件测试/人工智能|一文告诉你ChatGPT原理与架构
软件测试/人工智能|一文告诉你ChatGPT原理与架构
99 1
|
7月前
|
人工智能 安全 新能源
人工智能原理概述 - ChatGPT 背后的故事8
4.3 训练过程 虽然经过上述过程,ChatGPT已经可以自主的组织句子回答了。但如果没有适当的指导,该模型也可能生成不真实或者负面的输出。
|
7月前
|
机器学习/深度学习 人工智能 算法
人工智能原理概述 - ChatGPT 背后的故事6
该模型经过训练,可以在给定输入Token序列的情况下预测下一个Token。它能够生成语法正确且语义类似于其所训练的互联网数据的结构化文本。