AI发展与GPT简介

简介: 人工智能(AI)是指计算机系统执行通常需要人类智能的任务的能力,如视觉感知、语音识别、决策制定和语言翻译。简而言之,AI就是让计算机模仿人类的思考和行为过程。

一、AI发展写在前面

通过搜索引擎搜索你也不难找到,人工智能(Artificial Intelligence,简称AI),我们文中后续也将以“AI”代替“人工智能”为大家科普相关的内容。


什么是AI用大白话来说就是输入处理和输出,输入就是各种信息的灌入,而输出就是经过处理之后返回给我们的解决方案。

人类历史洪流中有很多聪明的人,他们共同的特点就是有个聪明的大脑,因此他们在处理事情上有经验、有能力、有逻辑、有情感,还有其独特的个人魅力。那么所谓AI能就是把中间这个处理的过程形成一种智能化的处理方式。


举个例子🌰:想必大家知道霍金很聪明,那AI就可以模拟出了霍金的大脑,从理论上来说,你问任何一个跟物理学、天文学相关的知识,经过这个AI大脑就能输出你想要的满意答案,这就是简单的AI模型!


当前AI可以帮助我们处理很多事情,比如辅导小孩子作业、学习编程、学习AI知识、听音乐、充当英语老师、查文献、写论文等等,几乎涵盖了绝大多数的职业。


AI的种类也有很多:有做饭炒菜的、有会端茶递水的、有会导航领路的,马斯克甚至研发出来了能给你生孩子还不生气的女友机器人。AI的形态也会随着人类的需要衍生出更多为我们服务的“人工智能”;


自1943年起,AI经历了从理论初期、技术探索、到广泛应用的漫长发展历程。接下来我们将围绕人工智能的发展史,分析一些关键技术和重要事件时间节点,并探讨未来AI发展趋势。

一)AI初期阶段

1.神经网络理论的诞生

早在1943年,美国两位来自神经科学领域的专家沃伦·麦卡洛克和逻辑学家沃尔特·皮茨共同提出了神经网络的数学模型,这为日后AI人工智能学科奠定了基础。

2. 图灵测试

作为一名IT互联网从业者,应该无人不知艾伦·图灵的大名,他1950发表的《计算能思考吗?》中提到了著名的图灵测试概念 。

图灵测试的原理是通过测试机器判断AI是否具备“人”的能力,判断标准就是机器与人类进行自然语言对话,人类来分辨在跟自己聊天的是不是机器人如果无法分辨出就认为通过了图灵测试(智能or非智能)。

这个概念也成为AI领域的重要基石,为了纪念图灵作出的贡献,1966年计算机领域制定了图灵奖,图灵也荣获“人工智能”之父的头衔。


3. 早期AI应用

棋类的游戏很多,但1951年,IBM科学家亚瑟·塞缅尔开发的西洋棋计算机程序,这是首个使用AI进行游戏对战的程序之一,游戏的主要核心是AI会根据当前的棋局分析和调整应对的策略,使得自己越来越强大。

这个早期的AI应用标志着AI在游戏产业上的发展基础。

4. AI元年

达特茅斯会议 可以说是确定人工智能发展的重要会议,1956年8月达特茅斯会议由一众大佬联合参会,会中约翰·麦卡锡正式提出了“人工智能”一词。

这个会议标志着人工智能作为独立学科正式被世人所知晓,AI正式诞生,此后为了纪念约翰·麦卡锡,把1956年称为AI元年,约翰·麦卡锡也荣获“AI之父”之名。

二)AI发展黄金时期

1. 机器学习概念提出

前面说过打造早起AI应用的亚瑟·塞缅尔,在1959年再次提出了机器学习的概念,机器学习被称之为人工智能的核心,也是计算机拥有“智能”特质的本质。

同在这个时期人工智能开始在农业、医疗行业、工业等方向开始发展和应用,后来亚瑟·塞缅尔 也被称之为“机器学习”之父学习Python的同学应该很熟悉。


2. 人工智能威胁论

随着AI发展势头逐渐扩大,引起了很多社会人士的广泛关注,其中也不乏著名的数学家I.J.古德。

早在1965年他提出了“人工智能威胁论”的概念,从他的角度认为AI的大力发展在未来必然会对人类产生威胁。

虽然这一观点当时引发了社会对AI发展的警惕,但并未阻止AI技术迭代更新。

I.J.古德 可以算作是提出AI威胁论的第一人,至今为止马斯克、比尔盖茨、扎克伯格等人都提出过相关的言论。


3. 医疗机器人诞生

1966年,全球首个由Joseph Weizenbaum 开发的AI医疗机器人Eliza诞生,Eliza的诞生当时也轰动了整个心理咨询行业,她可以模拟心理医生和病人进行对话,数据采用了匹配模式,200行代码搞定的软件虽然功能简陋,但Eliza的诞生从此拉开了人机对话的序幕。

Eliza也成为了当前发展势头很猛的ChatGPT应用的开山鼻祖。


4. Agent应用诞生

1968年,爱德华·费根鲍姆提出了首个专家系统,定义了知识库,推动了第二次人工智能浪潮。

专家系统就是现在的Agent系统,利用后台丰富的知识库来模拟各个领域的专家,目前Agent也广泛应用在了医疗、工程、金融分析、故障诊断等领域,目前我们使用的各种AI对话机器人就是基于Agent来做的。

如果对Agent感兴趣,后期我们也会单独开一个专题来讲解。


三)AI发展低谷期

1. 神经网络的局限性

就在所有人都希望看到人工智能将快速发展的时期,1969年著名的符号主义代表人物马文·明斯基在其著作《感知机》中指出了人工神经网络的局限性且多层神经网络的训练并不有效。

给当时很多从事AI领域研究的专家和学者带来了巨大的打击,由此AI领域的发展也进入到了低谷期,再未来10年AI研究及发展进入缓慢发展期。

2. 世界第一个AI机器人

尽管研究进入低谷期,但新技术依然涌现依然牛掰。

1972年,Shaky机器人亮相,这是第一个真正意义上的AI机器人。


3. 反向传播算法

1974年,哈佛大学博士保罗·沃博斯在论文中提出了使用反向传播算法,主要目的是用它来训练神经网络,推出后并不被人工智能领域的研究者看好,但众所周之现如今,反向传播算法是作为人工智能的核心算法,为深度学习奠定了基础。


四)AI发展复兴期

1. 无人驾驶系统

1989年,卡内基梅隆大学研发出了第一套无人驾驶系统,成功实现自动驾驶,标志着自动驾驶技术的发展进入萌芽期。


2. 深蓝击败国际象棋冠军

1996年,IBM的超级计算机深蓝系统首次挑战国际象棋世界冠军加里·卡斯帕罗夫,但意料之中人类战胜了机器人。尽管深蓝系统首次挑战失败,但一年之后,1997年升级版的深蓝系统以3胜2败1和的战绩成功击败了人类选手卡斯帕罗夫。

此次人脑败于AI引起众多人的关注与思考,也为AI发展史奠定了重要的里程碑。

3. 深度学习元年

2006年,杰弗里·辛顿和一批学者共同提出了深度学习的概念,掀起了深度学习在学术界和工业界的浪潮。

深度学习通过大量计算学习数据的高阶表示,极大地推动了人工智能的发展,后来2006年也被称之为“深度学习”元年杰弗里·辛顿被称之为“深度学习”之父。

五)AI的发展高速期

1. AlphaGo

2016年,由谷歌研发的AlphaGo横空出世,首战挑战世界围棋冠军围棋9段的李世石告捷,并以4:1的比分获胜。

一年之后2017年再度挑战世界围棋排名第一的柯洁,再次以3:0的成绩大获全胜,由此可见AI已经在特定领域超越人类顶尖水平,这也标志着AI在复杂算法中的突破。


2. ChatGPT和OpenAI的崛起

2019年,OpenAI发布了初代版本ChatGPT,引起广泛关注。

同年,OpenAI开发的Five在Dota2项目中击败了世界冠军OG战队。

2020年,OpenAI发布了GPT-3,其参数规模达到了1750亿,参数翻了一百倍,展示了强大的文本生成和理解能力。

3. Sora模型

2024年,OpenAI发布了Sora模型,可以根据文本生成视频,使AI视频生成更加接近真实。

OpenAI也被冠名成为最先进的AI技术代名词。

六)AI未来发展愿景


1、目前我们需要去深入了解的ChatGPT也属于AI的一种形态,它是可以和我们进行交流互动的机器人,就像我们和朋友、家人、客户一样沟通的聊天机器人。

2、但随着AI技术的突破性发展,许多人关注的是其潜在的伦理和安全问题。这个问题无法规避,也确实客观存在,为了确保AI系统的透明性、公正性和安全性,避免AI被滥用,可能将是未来AI研究的重要方向。

3、未来,人工智能将与人类形成更加紧密的协作关系。通过增强现实(AR)、虚拟现实(VR)等技术,AI可以更好地辅助人类工作和生活,提高生产效率和生活品质。


二、GPT简介

一)了解ChatGPT

前面提到了ChatGPT是由全球最酷的AI技术公司OpenAI研发的AI工具,既然说到ChatGPT,这里我们就来拆解一下火爆全球的 ChatGPT !

"GPT"是“Generative Pretrained Transformer”的缩写,是一种由OpenAI开发的人工智能技术,主要用于自然语言处理。GPT通过分析和处理大量文本数据,学习如何生成自然且连贯的文本。

GPT 的核心由三部分组成,分别是GenerativePretrainedTransformer

1、Generative

“Generative”(生成式)指的是它能够生成新的文本,它是一个生成性的AI,生成性 AI 和以往的人工智能有什么本质的区别?我们以深度学习为例来拆解一下,在这个领域里面有个经典的问题,就是我如何让机器知道狗是一只狗。


以往的方式,我在输入端找到成百上千张狗的相关照片,然后在输出端用人工进行标记,告诉人工智能你的选择是正确还是错误的,经过大量的学习,在中间这个黑箱中间,根据卷积神经网络,它就会分层去列举出狗的不同要素,比如说狗有两只耳朵,狗有尖尖的鼻子,狗分为很多品种,狗的毛发很软等等。


当然我只是简化了它所谓的算法,真正的算法分层是非常复杂的,人脑是不可能理解这种复杂的算法的,但是原理基本是一样的,最终是通过大量的投喂数据给人工智能,让它识别出狗是一只狗。


那么对于生成性 AI ChatGPT 来说,它往前走了非常大一步,我们可以直接告诉AI,你帮我画一只狗,这在以往的 AI 是完全做不到的,它没有创造性。


而新的生成式的人工智能,它是可以根据自己学习过的资料和数据去创造生成完全不存在于这个世界上的事物的。

简单的说,它具有创造性了,现在我们使用的ChatGPT,它只能进行文字的输入和文字的输出。在 ChatGPT 更新到 4.0 之后,我们是可以进行图像相关的输入的,但是输出依然是文字。但这并不代表 OpenAI 后面的算法不能够进行大模型的输出和多模态的输出。比如说利用 ChatGPT 3.5 和 4.0 作为内核去生成的一些软件,其实已经能够处理非常复杂的问题了。


2、Pretrained

“Pretrained”(预训练)意味着在被用于特定任务之前,它已经在大量文本上进行了足够多次的学习。ChatGPT之所以它回答的越来越人性化,是因为它所谓的语料是真实的人在互联网事件里面所发的所有的信息。这里稍微剧透一下,虽然现在是 GPT 4,但实际上很有可能 GPT5 已经在路上或者说早就训练完成了。


咱们以 GPT4 为例实际上它的语料是来源于 2022 年之前的所有互联网上的信息。它为什么会如此聪明?因为它已经阅读了几乎所有人类相关的知识,它相当于所有人类最好的工程师的集合、所有人类最好的剧作家、律师、金融分析师跟相关各个行业的专家的集合。而你要做的事情是如何调动它的大脑,问出最好的问题,让它把本来就知道的答案输送给你;


ChatGPT 的这个预学习过程使用了两个核心技术,第一个叫监督学习,第二个叫通过人类反馈强化学习。什么意思?你把非常好的语料给它,它会自动去选择那些有价值的内容,选择性的记忆,并且形成一个强的注意力,然后根据这个机制去不断让自己变得越来越好。


比如说你把非常多的诗歌文章喂给它,这个时候当你和它对话的时候,你说 ChatGPT 帮我写一首什么什么样场景的诗,它相当于是一个饱读诗书的诗人的集合,临场能为你创作一首新的诗,这点它能做到而且比大多数人做得更好。

3、Transformer

“Transformer”是一种特定的模型架构,用于处理序列数据;直译过来是变换器,或者叫变形金刚。咱们是不是有部电影叫变形金刚?我也是影迷,但如果你直译过来就错了。


其实 Transformer 它不是代表变换器,它其实是一种非常底层的深度神经算法网络的名称。它是在 2017 年由谷歌的 Google brain 谷歌大脑的团队开发完成,但是很遗憾的是谷歌自己并没有把这项研究成果发扬光大,而是由隔壁的 Microsoft 微软利用 OpenAI 把它做大做强了,我相信现在可能谷歌的高管们肠子都悔青了。


Transformer 底层有两个机制,第1个叫做选择性记忆,第2个叫注意力机制。

咱们重点讲一下注意力机制,这个稍微有点烧脑,大家理解一下就好。有这样一个场景,当我讲一句话的时候,其实每一个单词它的权重是不一样的,你调换不同单词的位置,它的意义又会发生改变。那 Transformer 就是允许 AI 在读取不同语料的时候,根据他的理解和他的注意力分配去变换不同语料的权重,它允许这种算法在非常大的数据维度上去进行训练。


因此你可以这么去理解,就是有一个是好学生,老师教他什么他就说什么。另外一个是脑子比较活络的一个打引号的坏学生,他总是愿意去多想一步,或者多想一些,最后你发现你身边那些坏孩子可能生意做得更好,对不对?这就是神秘而强大的GPT。


二)场景

用ChatGPT自己的认知来解释“自己“的场景如下:

1、GPT3.5的回答

2、GPT4的回答

3、常用场景

通过ChatGPT3.5、4.0给的应用场景以及当下很多公司、团队、个人的真实应用场景总结:目前应用场景几乎覆盖了全领域,常见的办公领域、教育、IT互联网、医疗健康、金融服务、自动驾驶、零售和电商、制造业、语言处理、农业、智能家居等

三、总结


回顾人工智能的发展史,我们可以看到AI技术从发展初期到发展黄金期,再到低谷与复兴,经历了多个重要阶段。

每一次技术突破和进展都离不开科学领域研究者们的不断探索和努力。


随着科技的不断进步和社会需求的不断增长,以OpenAI为首的AI创新技术将在未来继续发挥重要作用,为人类社会带来更多的改变和机遇。

我们需要以开放的态度迎接AI技术的发展,同时重视其潜在的挑战和问题,推动AI技术在更加安全、透明和公正的轨道上前行。

目录
相关文章
|
5天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
25天前
|
人工智能 自然语言处理 安全
Google Gemini 1.5 Pro在AI竞赛中遥遥领先,挑战GPT-4o
Google Gemini 1.5 Pro在AI竞赛中遥遥领先,挑战GPT-4o
Google Gemini 1.5 Pro在AI竞赛中遥遥领先,挑战GPT-4o
|
13天前
|
人工智能 自然语言处理 小程序
【AI】Gemini:听说GPT-4你小子挺厉害
谷歌推出新AI模型Gemini Pro,支持中文并具备多模态处理能力,涵盖文本、图像、音频、视频和代码。本文通过五个问题对比Gemini Pro与ChatGPT-4的表现,包括绘画、数学题解答、成语解释、天气查询及奥运冠军名单。结果显示两者各有优势,Gemini Pro在成语解释和天气查询方面略胜一筹,而ChatGPT-4在绘画方面表现更好
20 0
【AI】Gemini:听说GPT-4你小子挺厉害
|
18天前
|
人工智能 自然语言处理 语音技术
使用AI识别语音和B站视频并通过GPT生成思维导图原创
AI脑图现新增语音及B站视频内容识别功能,可自动生成思维导图。用户可通过发送语音或上传语音文件,系统自动转换为文本并生成结构化的思维导图;对于B站视频,仅需提供链接即可。其工作流程包括:语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。
25 0
|
1月前
|
人工智能 API 异构计算
震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型
震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型
89 2
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
114 9
|
2月前
|
人工智能 数据挖掘 机器人
同样是人工智能 客户在哪儿AI和GPT等大模型有什么不同
客户在哪儿AI生产的是企业全历史行为数据,同时还针对ToB企业,提供基于企业全历史行为数据的数据分析服务。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
揭开AI的神秘面纱:人工智能简介
这是一篇人工智能简介,从人工智能的定义,起源,分类,相关技术,应用前景与存在的挑战几个方面介绍人工智能
|
2月前
|
存储 SQL 数据库
Python 金融编程第二版(GPT 重译)(四)(4)
Python 金融编程第二版(GPT 重译)(四)
29 3
|
2月前
|
存储 NoSQL 索引
Python 金融编程第二版(GPT 重译)(一)(4)
Python 金融编程第二版(GPT 重译)(一)
37 2