背景
最近chatgpt
智能对答火的一塌涂地,就是你找chatgpt
咨询,它不仅能理解你的意思,还能给出准确的答案,而且能够从上下文理解你的意思。
简单的说,就不再是之前的智能对答,如果遇到不理解的问题回复【我好像不太理解你的问题】。
更有甚者,利用chatgpt完成论文编写,同时还有帮小孩子写作业、程序员利用它整理某个业务的实现思路,作者利用其帮忙写小说细节等等。
我尝试问了一些常规问题,如下图所示,可以更好的理解chatgpt
的能力。
1.如何以Nest.js
框架实现用户登录功能
2.直接将高考作文题要求放入,如下:
请以“像一道闪电”为题目,写一段抒情文字或一首小诗。要求:感情真挚,语言生动,有感染力。要求800字。 —— 2022年北京卷
因此,作为程序员,没有理由不去深入且完整的了解它,故而有这篇小白科普文。
概念
为了更好的了解后面的内容,我们需要提前对一些知识概念了解一下。
人工智能
人工智能 (AI) 是计算机模拟人类智能行为的功能。 通过 AI,计算机可以分析图像、理解语音、以自然方式交互,以及使用数据进行预测。
目前AI开发流程分为:
1.确定目的模型,AI最终是用来做什么,如:图像识别、语言识别等
2.准备训练数据,收集和预处理数据,如:要识别一只猫,可能需要几十万张不同猫的图片
3.训练模型,也叫建模,通过各种算法、方法和技巧去创建,最终输出模型,如:从不同图片中去识别猫的,需要写算法、然后标注结果是否准确,这里的模型你可以理解成“只会识别猫的眼睛”
4.评估模型,反复的调整算法参数、数据,不断评估训练生成的模型,最终得到满意的模型,如:告诉【眼睛模型】哪些图片是猫,哪些图片不是猫,猫的特征有什么,直到【眼睛模型】可以识别出所有的猫的图片和不是猫的图片
5.部署模型,将模型应用到正式的实际数据或新产生数据中,进行预测、评价,如:把【眼睛模型】去接触真实世界,看到一些真实猫图片或视频
总结来说,AI就是可以模拟人的部分行为,如上文举例所说的【眼睛模型】,就是实现人类眼睛可以识别猫的功能,扩展开来就是可以充当人的眼睛去识别万物。
当然有些更加智能的模型可以重复2/3/4三个步骤让自己变得更加完善(这也叫【无监督模型或自监督模型】)。
语言模型
从前面了解到【模型】的概念,从通俗的理解模型是一个模仿人类某个功能,从技术上讲模型是一段算法代码。
因此语言模型从这两个方面来说:
- 许多自然语言处理方面的应用,如:语音识别[1],机器翻译[2],词性标注,句法分析[3],手写体识别[4]和资讯检索
- 从技术上来讲,是一个概率分布的算法
我们对语言模型可以理解成,一个能够识别自然语言(包括语音,语义识别等)的算法模型即可。
常用的语言模型算法有以下几种:
- ELMo 华盛顿大学提出的算法
- GPT OpenAI提出的算法
- BERT Google提出的算法
GPT
Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。
GPT的整个发展过程分为:
- GPT-1,有一定的泛化能力,能够用于和监督任务无关的 NLP 任务,如:自然语言推理:判断两个句子的关系;问答与常识推理:输入文章及若干答案,输出答案的准确率等
- GPT-2,使用无监督预训练模型做有监督任务,比GTP-1拥有更加强大能力,能阅读摘要、聊天、续写、编故事,甚至生成假新闻等,甚至可以假扮网络角色进行会话聊天,如:微软的小冰。
- GPT-3,作为一个无监督模型,几乎可以完成自然语言处理的绝大部分任务,如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。
- GPT3.5,是一系列模型,使用
人类反馈强化学习(RLHF)
,与GPT-3
最大的区别在使用互联网的资料直接训练。 - GPT-4,针对GPT-3不分青红皂白和质量好坏地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出的缺陷,而准备提出新的升级模型。
一个无监督模型功能多效果好,似乎让人们看到了通用人工智能的希望,可能这就是 GPT-3 影响如此之大的主要原因。
有了这些概念性的知识后,我们就可以开始认识ChatGPT
。
ChatGPT
是什么
在官网上定义如下:
ChatGPT: 专门针对对话而优化的语言模型。同时已经训练了一个名为ChatGPT的模型,它以对话的方式进行交互。对话形式使ChatGPT能够回答后续问题,承认错误,挑战不正确的前提,拒绝不适当的请求。ChatGPT是InstructGPT的兄弟模型,InstructGPT被训练为遵循提示中的说明并提供详细的响应。 —— ChatGPT官网
按照我所理解来说,ChatGPT是:
- 一个基于
GPT-3.5系列模型
+人类反馈强化学习(RLHF)
实现的语言模型 - 一个可以正常对话聊天、自动纠正错误的智能对话机器人(快速,而不需要等待太长时间)
- 一个链接互联网所有公开信息,能检索到所有信息和总结的智能搜索引擎
- 一个可以辅助你实现相关工作(如:作业,代码,论文等)的智能工具
InstructGPT VS ChatGPT
- 两者都是基于
GPT-3.5系列模型
做调整的语言模型 InstructGPT
是一个问题就一个回答,如果回答不正确就调整,ChatGPT
则是一个问题就多个回答,然后学习将这些回答进行排序
如何使用:
其实如果可以直接访问ChatGPT官网就可以直接用,国内也有很多插件可以使用。
影响什么
ChatGPT的火爆是AI多年沉淀的一次技术爆发,距离上一次AI技术的热点新闻还是在谷歌的阿尔法狗战胜世界围棋冠军李世石(2016年)。
我们可以先收集一下目前使用AI技术的一些场景:
- 各种识别,人脸、指纹等
- 智能辅助驾驶
- 各种转义,如:语音转文字,文字转语音, 翻译等
- 各种语音助手,如:Siri,小爱同学等
其实,AI在我们生活中已经随处可见,只是有时候我们觉得这些功能还是比较属于机器范围内的,如有时候小爱同学会说“我没听清楚你的问题”这种明显非智能回答,给我们造成一种认知觉得AI很傻。
因此,ChatGPT的火爆之处在于:它真的可以像一个人类给予你想要的回答,更加准确的说,它是一个负责任的智能AI,能竭尽所能的给你想要的答案。
接下来,我从网上搜索了一些资料,从几个行业讲一下它可能会带来的影响。
教育行业
其实最大的担心就是,大家利用chatgpt去写作业或论文,尤其是学龄前儿童和中小学阶段,正是属于知识探索期,chatgpt是否会影响学生的学习吗?
这里引用一段话,针对国内的,吴永和教授的一个观点:
面向未来,作为承担2021年度国家社会科学基金重大项目“面向未成年人的人工智能技术规范研究”的首席专家,吴永和从五个方面给出了教育人工智能发展的建议:
- 一、是进行理论的奠基,确定价值观、战略方向,做好顶层设计;
- 二、是提升人类的人工智能核心素养,从而使师生能正确驾驭智能工具;
- 三、是完善技术应用的监管,保持人工智能的向善性,使技术能够更好地为人服务;
- 四、是考虑技术和教育深度融合的伦理问题,更好地做到人机共融;
- 五、是落实相关标准,比如教育人工智能的算法描述信息、安全描述框架、伦理审查规范。
IT行业
网络已经有很多人利用chatgpt去生成代码甚至正式上线,那么是否会代替程序员,或者以后程序员已经如何学习发展?
这里引用知乎上的一个问答OpenAI 的超级对话模型 ChatGPT 会导致程序员大规模失业吗?,总结一下精彩回答:
- chatgpt作为一个管家型查找,把喂到你嘴里这个功能发挥到了极致。
- chatgpt给出的代码实现和"背题家"也出奇的相似
- chatGPT最多能看作一个助手, 对于广大程序员来说是一个不错的辅助工具
- AI的发展已经明确告诉你了,不要卷细节上的东西,提升核心竞争力,就是你的解决问题的思路
- 没有思想的人才是最快被取代的
- ChatGPT 又来了,这次我是什么感觉呢?感觉真的 Google 和 StackOverflow 已经不好用了
- 借助 Copilot 和 ChatGPT,程序员的自我感觉更棒了!可以更加肆无忌惮地在未知领域里自由探索了!
其他行业
引用知乎上的问答ChatGPT 会取代人的哪些工作?哪些人群的职业规划需要转变?,总结一下精彩回答:
- 内容行业:文字+图像处理效率的提升,更加庞大的内容生态也有了存在的基础,推动芯片和硬件的提升,从而实现更宏大的数字世界
- 游戏行业:npc会和你流畅的对话,黄油里面可以根据你的xp来叫主人或者变态,新的需求会生成,也催生新的经济形态
- 这将是人工智能诞生以来,人类的工作第一次真正接近被大规模替代的时点——不是部分工作被替代,而是大规模被替代的开始。
- ChatGPT的商业模式,可能不会像搜索那样依赖广告,难以出现大规模的2C级应用,而更可能是2B,主要运用于工作场景
- 会提问题的人将是最后的赢家,可以让你的工作不但不会被AI取代,反而创造了全新的工作方式
总结
第一篇关于ChatGPT的了解就先写到这里,作为AI小白,我们可以学习到:
- AI模型是的训练过程:确定模型>准备数据>训练模型>调整模型>部署模型
- ChatGPT的实质定义,利用互联网的资料训练
GPT-3.5模型
而成的一个对话式的语言模型 - ChatGPT的出现可能带来的改变,可以将某些行业岗位的价值重新定义,但是却能提高更多岗位的工作效率和价值,从而提升整个社会运转速度
最后,问ChatGPT我能从你这里学到什么?如下图: