可以从ChatGPT学到什么(一)

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 最近chatgpt智能对答火的一塌涂地,就是你找chatgpt咨询,它不仅能理解你的意思,还能给出准确的答案,而且能够从上下文理解你的意思。

背景


最近chatgpt智能对答火的一塌涂地,就是你找chatgpt咨询,它不仅能理解你的意思,还能给出准确的答案,而且能够从上下文理解你的意思。


简单的说,就不再是之前的智能对答,如果遇到不理解的问题回复【我好像不太理解你的问题】。


更有甚者,利用chatgpt完成论文编写,同时还有帮小孩子写作业、程序员利用它整理某个业务的实现思路,作者利用其帮忙写小说细节等等。


我尝试问了一些常规问题,如下图所示,可以更好的理解chatgpt的能力。

1.如何以Nest.js框架实现用户登录功能

8ba93393d496e42d68a240d529c610f.png

2.直接将高考作文题要求放入,如下:

请以“像一道闪电”为题目,写一段抒情文字或一首小诗。要求:感情真挚,语言生动,有感染力。要求800字。 —— 2022年北京卷

93d87d850455e5bbb39f963f279dafb.png

因此,作为程序员,没有理由不去深入且完整的了解它,故而有这篇小白科普文。

概念


为了更好的了解后面的内容,我们需要提前对一些知识概念了解一下。

人工智能


人工智能 (AI) 是计算机模拟人类智能行为的功能。 通过 AI,计算机可以分析图像、理解语音、以自然方式交互,以及使用数据进行预测。

目前AI开发流程分为:

1.确定目的模型,AI最终是用来做什么,如:图像识别、语言识别等

2.准备训练数据,收集和预处理数据,如:要识别一只猫,可能需要几十万张不同猫的图片

3.训练模型,也叫建模,通过各种算法、方法和技巧去创建,最终输出模型,如:从不同图片中去识别猫的,需要写算法、然后标注结果是否准确,这里的模型你可以理解成“只会识别猫的眼睛”

4.评估模型,反复的调整算法参数、数据,不断评估训练生成的模型,最终得到满意的模型,如:告诉【眼睛模型】哪些图片是猫,哪些图片不是猫,猫的特征有什么,直到【眼睛模型】可以识别出所有的猫的图片和不是猫的图片

5.部署模型,将模型应用到正式的实际数据或新产生数据中,进行预测、评价,如:把【眼睛模型】去接触真实世界,看到一些真实猫图片或视频


总结来说,AI就是可以模拟人的部分行为,如上文举例所说的【眼睛模型】,就是实现人类眼睛可以识别猫的功能,扩展开来就是可以充当人的眼睛去识别万物。


当然有些更加智能的模型可以重复2/3/4三个步骤让自己变得更加完善(这也叫【无监督模型或自监督模型】)。

语言模型


从前面了解到【模型】的概念,从通俗的理解模型是一个模仿人类某个功能,从技术上讲模型是一段算法代码。


因此语言模型从这两个方面来说:

  • 许多自然语言处理方面的应用,如:语音识别[1],机器翻译[2],词性标注,句法分析[3],手写体识别[4]和资讯检索
  • 从技术上来讲,是一个概率分布的算法


我们对语言模型可以理解成,一个能够识别自然语言(包括语音,语义识别等)的算法模型即可。


常用的语言模型算法有以下几种:

  • ELMo 华盛顿大学提出的算法
  • GPT OpenAI提出的算法
  • BERT Google提出的算法

GPT


Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。

GPT的整个发展过程分为:

  • GPT-1,有一定的泛化能力,能够用于和监督任务无关的 NLP 任务,如:自然语言推理:判断两个句子的关系;问答与常识推理:输入文章及若干答案,输出答案的准确率等
  • GPT-2,使用无监督预训练模型做有监督任务,比GTP-1拥有更加强大能力,能阅读摘要、聊天、续写、编故事,甚至生成假新闻等,甚至可以假扮网络角色进行会话聊天,如:微软的小冰。
  • GPT-3,作为一个无监督模型,几乎可以完成自然语言处理的绝大部分任务,如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。
  • GPT3.5,是一系列模型,使用人类反馈强化学习(RLHF),与GPT-3最大的区别在使用互联网的资料直接训练。
  • GPT-4,针对GPT-3不分青红皂白和质量好坏地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出的缺陷,而准备提出新的升级模型。

一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是 GPT-3 影响如此之大的主要原因。

有了这些概念性的知识后,我们就可以开始认识ChatGPT

ChatGPT


是什么


在官网上定义如下:

ChatGPT: 专门针对对话而优化的语言模型。同时已经训练了一个名为ChatGPT的模型,它以对话的方式进行交互。对话形式使ChatGPT能够回答后续问题,承认错误,挑战不正确的前提,拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型,InstructGPT被训练为遵循提示中的说明并提供详细的响应。 —— ChatGPT官网

按照我所理解来说,ChatGPT是:

  • 一个基于GPT-3.5系列模型 + 人类反馈强化学习(RLHF)实现的语言模型
  • 一个可以正常对话聊天、自动纠正错误的智能对话机器人(快速,而不需要等待太长时间)
  • 一个链接互联网所有公开信息,能检索到所有信息和总结的智能搜索引擎
  • 一个可以辅助你实现相关工作(如:作业,代码,论文等)的智能工具


InstructGPT VS ChatGPT

  • 两者都是基于GPT-3.5系列模型做调整的语言模型
  • InstructGPT是一个问题就一个回答,如果回答不正确就调整, ChatGPT则是一个问题就多个回答,然后学习将这些回答进行排序


如何使用:

其实如果可以直接访问ChatGPT官网就可以直接用,国内也有很多插件可以使用。

影响什么


ChatGPT的火爆是AI多年沉淀的一次技术爆发,距离上一次AI技术的热点新闻还是在谷歌的阿尔法狗战胜世界围棋冠军李世石(2016年)。


我们可以先收集一下目前使用AI技术的一些场景:

  • 各种识别,人脸、指纹等
  • 智能辅助驾驶
  • 各种转义,如:语音转文字,文字转语音, 翻译等
  • 各种语音助手,如:Siri,小爱同学等


其实,AI在我们生活中已经随处可见,只是有时候我们觉得这些功能还是比较属于机器范围内的,如有时候小爱同学会说“我没听清楚你的问题”这种明显非智能回答,给我们造成一种认知觉得AI很傻。


因此,ChatGPT的火爆之处在于:它真的可以像一个人类给予你想要的回答,更加准确的说,它是一个负责任的智能AI,能竭尽所能的给你想要的答案。

接下来,我从网上搜索了一些资料,从几个行业讲一下它可能会带来的影响。

教育行业


其实最大的担心就是,大家利用chatgpt去写作业或论文,尤其是学龄前儿童和中小学阶段,正是属于知识探索期,chatgpt是否会影响学生的学习吗?


这里引用一段话,针对国内的,吴永和教授的一个观点:

面向未来,作为承担2021年度国家社会科学基金重大项目“面向未成年人的人工智能技术规范研究”的首席专家,吴永和从五个方面给出了教育人工智能发展的建议:

  • 一、是进行理论的奠基,确定价值观、战略方向,做好顶层设计;
  • 二、是提升人类的人工智能核心素养,从而使师生能正确驾驭智能工具;
  • 三、是完善技术应用的监管,保持人工智能的向善性,使技术能够更好地为人服务;
  • 四、是考虑技术和教育深度融合的伦理问题,更好地做到人机共融;
  • 五、是落实相关标准,比如教育人工智能的算法描述信息、安全描述框架、伦理审查规范。


IT行业

网络已经有很多人利用chatgpt去生成代码甚至正式上线,那么是否会代替程序员,或者以后程序员已经如何学习发展?


这里引用知乎上的一个问答OpenAI 的超级对话模型 ChatGPT 会导致程序员大规模失业吗?,总结一下精彩回答:

  • chatgpt作为一个管家型查找,把喂到你嘴里这个功能发挥到了极致。
  • chatgpt给出的代码实现和"背题家"也出奇的相似
  • chatGPT最多能看作一个助手, 对于广大程序员来说是一个不错的辅助工具
  • AI的发展已经明确告诉你了,不要卷细节上的东西,提升核心竞争力,就是你的解决问题的思路
  • 没有思想的人才是最快被取代的
  • ChatGPT 又来了,这次我是什么感觉呢?感觉真的 Google 和 StackOverflow 已经不好用了
  • 借助 Copilot 和 ChatGPT,程序员的自我感觉更棒了!可以更加肆无忌惮地在未知领域里自由探索了!

其他行业


引用知乎上的问答ChatGPT 会取代人的哪些工作?哪些人群的职业规划需要转变?,总结一下精彩回答:

  • 内容行业:文字+图像处理效率的提升,更加庞大的内容生态也有了存在的基础,推动芯片和硬件的提升,从而实现更宏大的数字世界
  • 游戏行业:npc会和你流畅的对话,黄油里面可以根据你的xp来叫主人或者变态,新的需求会生成,也催生新的经济形态
  • 这将是人工智能诞生以来,人类的工作第一次真正接近被大规模替代的时点——不是部分工作被替代,而是大规模被替代的开始。
  • ChatGPT的商业模式,可能不会像搜索那样依赖广告,难以出现大规模的2C级应用,而更可能是2B,主要运用于工作场景
  • 会提问题的人将是最后的赢家,可以让你的工作不但不会被AI取代,反而创造了全新的工作方式

总结


第一篇关于ChatGPT的了解就先写到这里,作为AI小白,我们可以学习到:

  • AI模型是的训练过程:确定模型>准备数据>训练模型>调整模型>部署模型
  • ChatGPT的实质定义,利用互联网的资料训练GPT-3.5模型而成的一个对话式的语言模型
  • ChatGPT的出现可能带来的改变,可以将某些行业岗位的价值重新定义,但是却能提高更多岗位的工作效率和价值,从而提升整个社会运转速度

最后,问ChatGPT我能从你这里学到什么?如下图:

9ed52702bff21c62e1f7318e52c836d.png

参考资料

目录
相关文章
|
6月前
|
搜索推荐 UED
ChatGPT的推理过程
【1月更文挑战第8天】ChatGPT的推理过程
136 3
ChatGPT的推理过程
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
什么是chatgpt
ChatGPT是OpenAI开发的一种基于人工智能的聊天机器人技术,使用了先进的自然语言处理工具。
|
1月前
|
机器学习/深度学习 搜索推荐
ChatGPT的结果是如何生成的
ChatGPT的结果是如何生成的
|
2月前
|
Linux 调度
Schedutil 【ChatGPT】
Schedutil 【ChatGPT】
|
2月前
|
存储 安全 API
VFIO【ChatGPT】
VFIO【ChatGPT】
|
2月前
|
Web App开发 前端开发 Shell
控制组 【ChatGPT】
控制组 【ChatGPT】
|
2月前
|
缓存 算法 Linux
hwpoison 【ChatGPT】
hwpoison 【ChatGPT】
|
2月前
|
存储 算法 Linux
KSM 【ChatGPT】
KSM 【ChatGPT】
|
4月前
|
机器学习/深度学习 网络架构 异构计算
它比chatGPT4.0还要牛!!!
它比chatGPT4.0还要牛!!!
|
人工智能 程序员
Chatgpt可以帮我做的66件事情
Chatgpt可以帮我做的66件事情
175 0