技术下午茶:初识ChatGPT,触碰未来(3)

简介: 技术下午茶:初识ChatGPT,触碰未来

1.3 什么是ChatGPT

ChatGPT,是美国OpenAI公司开发的一种基于神经网络的预训练模型,它预先内置了1750亿的参数,我们可以理解为1750亿个数学公式,并且通过数以亿计的数据进行预先训练。

从1.0版本开始,ChatGPT还只会通过大量数据进行学习,进行上下文补齐。我们举一个例子,如图1-8所示:

image.png

图1-8 ChatGPT1.0问答

ChatGPT会从已经训练好的数据中查找答案,比如找到的数据中,回到“绩效管理”比较多,那么ChatGPT会给出回答“绩效管理”。这类似于稍微智能一点的搜索引擎,这是ChatGPT1.0做的事情,基于上文和下文出现的概率来给出答案。

到了2.0版本,ChatGPT已经可以熟练掌握填空题、判断题、问答题、或者帮助你查找错别字这种基于上下文处理的工作事项。

而2.0版本则增加了“多任务”的概念,这意味着ChatGPT可以同时做多个任务,当我们抛给GPT一个问题,它可以从多个方面回答这个问题,达到举一反三的效果。如图1-9所示:

image.png

图1-9 多任务处理

1.0版本和2.0版本看似已经非常强大了,但却存在一个很大的问题,即数据标识的问题。我们前面说过,ChatGPT是预训练模型,就像一个小孩子,它的学习过程需要大人引导输入数据,比如告诉它这是猫,那不是猫,ChatGPT才能在学习大量数据后,判断出这是不是猫。

由此暴露出的问题是,我们要给ChatGPT输入的每一项内容都做好标识,这在自然语言学习的领域称之为“监督学习”。监督学习海量的数据,那么就需要海量的人工去把数据做好标识,才能给到ChatGPT进行学习,这种方式的工作量和成本无疑是很可怕的。如图1-10所示:

image.png

图1-10 数据标注

到了ChatGPT3.0版本,科学家们提出了一个“小样本学习”的概念,即先给GPT少量的已经标识好的数据进行学习,后面使用大量没有标识的数据进行测试。这在自然语言学习的领域称之为“无监督学习”。和我们小时候学习的概念类似,老师先教概念,再举一些例子,后面由学生自主学习。

到了3.5的版本,ChatGPT在“监督学习”的基础上增加了“强化学习”的概念,即回答出的问题让用户进行打分,通过大量用户的使用和打分,将评分结果返过去再确认结果的准确性。

随着这一创新性的技术升级,自从2022年11月30日OpenAI开放ChatGPT以来,在短短的1周内就获得了全球100W的用户,而目前更是超过10亿的用户和月活1亿的用户,一跃成为了全球最热门的公司。如图1-11所示:

image.png

图1-11 OpenAI官网


相关文章
|
3月前
|
机器学习/深度学习 数据采集 存储
4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒
4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒
|
5月前
|
存储 自然语言处理 搜索推荐
ChatGPT 文本Embedding融合Qdrant向量数据库:构建智能问答系统的技术探索
向量数据库结合ChatGPT带来了什么 1. **语义搜索:** 使用向量数据库进行语义搜索,可以更准确地找到与查询相关的信息。ChatGPT可以理解用户的自然语言查询,而向量数据库可以根据语义相似性返回匹配的向量数据。 2. **智能推荐:** 结合ChatGPT的智能理解和向量数据库的相似性搜索,可以实现更智能的推荐系统。系统可以根据用户的历史行为和语境,向用户推荐相似的向量数据,如文章、产品或其他内容。 3. **自然语言处理与向量表示结合:** ChatGPT可以将自然语言转换为向量表示,这样就可以在向量数据库中进行更高效的查询。这种集成使得自然语言处理和向量数据库可以相互补充等
370 0
|
4月前
|
机器学习/深度学习 人工智能 算法
【极客技术】ColossalChat用完整RLHF技术克隆ChatGPT的开源解决方案
【极客技术】ColossalChat用完整RLHF技术克隆ChatGPT的开源解决方案
38 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
技术小白能看懂的ChatGPT原理介绍
网上有关 ChatGPT 的原理介绍文章一大堆,要么是从 NLP 的历史开始讲起,要么是上数 GPT 3 代,内容都相对冗长和复杂。其实 ChatGPT 的原理并不难理解,我将以最通俗易懂的方式为技术小白解读,帮助大家更好地了解这一技术
503 1
技术小白能看懂的ChatGPT原理介绍
|
5月前
|
机器学习/深度学习 自然语言处理
ChatGPT技术基石之Transformer技术的简介(简单易懂)
ChatGPT技术基石之Transformer技术的简介(简单易懂)
49 0
|
5月前
|
人工智能 自然语言处理 算法
技术角度告诉你ChatGPT是什么?和一些深度思考
技术角度告诉你ChatGPT是什么?和一些深度思考
|
6月前
|
机器学习/深度学习 自然语言处理 机器人
ChatGPT发展与技术基础
ChatGPT发展与技术基础
138 1
|
6月前
|
人工智能 新能源 大数据
王坚院士谈ChatGPT:计算是对人工智能最关键的技术
王坚院士谈ChatGPT:计算是对人工智能最关键的技术
63 0
王坚院士谈ChatGPT:计算是对人工智能最关键的技术
|
6月前
|
人工智能
技术下午茶:初识ChatGPT,触碰未来(4)
技术下午茶:初识ChatGPT,触碰未来
62 1
技术下午茶:初识ChatGPT,触碰未来(4)
|
23天前
|
人工智能 IDE Linux
chatgpt的ai编程工具
该内容是关于两个chatgpt的ai编程工具的安装和使用说明。Copilot的下载步骤包括在IDE的设置中搜索并安装插件,然后重启IDE并登录GitHub账户。使用时,通过写注释触发建议,用快捷键选择建议。启用或禁用Copilot可通过底部状态图标。另一个工具是Alibaba Cloud AI Coding Assistant (Cosy),同样在IDE的插件市场下载安装后重启。其详细使用方法建议参考官网。
26 0