最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

作为史上最受期待的AI模型,GPT-4真要来了?

这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。

他表示,「GPT-4几乎准备就绪,并将于今年12月至明年2月的某个时间点发布」

甚至还有传言表示,GPT-4已经先进到「与人类无异」,甚至通过了图灵测试。和以前相比,企业引进成本也将大幅下降。

目前,整个AI界还没有出现「正式且肯定」能通过图灵测试的模型,因此GPT-4的推出——很可能成就AI史上又一个伟大的一年。

最快下月,第四代模型真快来了?


2020年6月,由埃隆·马斯克等人创立的世界级人工智能研究机构OpenAI发布了第三代生成式预训练模型GPT-3。

GPT-3拥有1750亿个参数,是上一代模型GPT-2的100倍,也一举将此前同类NLP模型的参数纪录提升了10倍。

GPT-3的发布被业界视为重大进展,也因此被《麻省理工科技评论》列为「2021十大突破性技术」。

巨大的性能飞跃,也让所有人对OpenAI的下一代生成式预训练模型寄予厚望。

假如GPT-4之于GPT-3的进步,就像GPT-3之于GPT-2一样大,那么这又将是一个接近100倍的提升。

但近两年来,OpenAI在谈及GPT-4时却一向非常「腼腆」,甚至可以说大多数时间都保持着沉默。我们仅能从管理层不经意间透露出的零星信息「管中窥豹」。

距离上一次GPT-4有消息流出,这还要追溯到今年年初。

当时OpenAI的首席执行官萨姆·阿尔特曼(Sam Altman)表示,GPT-4预计将在今年7月至8月发布。

然而近期,美国科技博主罗伯特·斯科布尔(Robert Scoble)却表示:

「颠覆即将来临。GPT-4比任何人的预期都要出类拔萃。它是将于明年推出的几大AI产品之一。」

Cambrian AI公司分析师阿尔贝托·罗梅罗(Alberto Romero)也在《算法桥》的专栏文章中,援引了硅谷工程师伊戈尔-拜科夫(Igor Baikov)9月时的一条推文:

「OpenAI已经在训练GPT-4,并计划于12月-2月间发布。」

此外,包含1.17亿个参数的第一代GPT,于2018年发布;2019年和2020年,我们分别迎来了GPT-2和GPT-3。

已然「矜持」了一年有余的OpenAI——或许也是时候推陈出新了。

「GPT-4能通过图灵测试,我不会惊讶」


对于GPT-4,一位AI创业公司的代表分析称,「GPT-4轻松通过了图灵测试,或间接表明性能足够高,已具备通过图灵测试的潜力。」

OpenAI CEO阿尔特曼近期的一篇推文,似乎也曾侧面印证了这个传闻。

他上传了一张星球大战的照片,上面写着一句话:

「不要为自己创造的『技术恐怖』而骄傲,通过图灵测试的能力在『原力』面前无能为力。」

这是对电影星球大战系列中著名角色达斯-维德 (Darth Vader) 经典台词的模仿。

罗梅罗也在文章中表示:

「如果GPT-4能充分通过图灵测试,我不会感到惊讶。」

图灵测试是一种检测方式,旨在了解计算机与人类交流的自然程度。

目前,AI界还没有「正式且肯定」通过图灵测试的AI模型。

尽管过去有一些人工智能模型声称已经通过了图灵测试,但因为其标准和规则并不明确,所以他们使用了一些「盲点」,并非全局通过了测试。

假如传闻是真的,GPT-4能不受限制地通过图灵测试,那它将成为当之无愧的「历史第一」

训练成本显著降低,商业化潜力巨大


AI圈对GPT-4的广泛关注还有一个原因:据说未来商业服务引入GPT-4的实际门槛,将远低于现有的GPT-3模型。

与此同时,预计由于巨大的成本和所需要的基础设施而无法使用AI技术的公司,也将有更多的空间使用GPT-4。

根据罗梅罗的预测,OpenAI将下一代模型的重点更多地放在优化数据处理上,而不是参数大小上,因此GPT-4的规模很可能与GPT-3相似。

到目前为止,人工智能技术的进步和模型尺寸的扩展是一起进行的,但近期为轻量化模型增加功能被认为是很有前景的。

GPT-4的模型训练成本有望比以前更低。罗梅罗写道,「GPT-4的训练成本预计将显著低于GPT-3」。

众所周知,GPT-3仅在学习阶段每节课就要花费数十万。这也是为什么大公司无法轻而易举为普通用户发布基于GPT-3的人工智能服务。

在韩国,仅有SK Telecom公司的的个人人工智能服务「Adot」基于GPT-3。

罗梅罗还表示,GPT-4的每次训练成本有望降至100万美元以下。

一位ICT公司官员表示:

「如果所有已知的信息都是真的,那么明年将会出现几种聊天机器人服务。它们是如此自然,以至于用户不知道他们是在与人交谈还是在与计算机交谈。」

「人工智能服务可能会增加。」

网友:需要警惕


对于OpenAI的下一代「灭霸」级模型,不少网友纷纷表示「太期待了」。

然而,著名AI学者、Robust.AI的创始人兼CEO盖瑞·马库斯(Gary Marcus)却再次唱衰了GPT-4的前景。

他在社媒表示:「有传言说GPT-4即将到来。下面我的预测:它仍然会存在严重的虚构/错误信息、毒性和偏见问题。」

马库斯对AI行业的关注众所周知,但也发表过许多诸如「深度学习撞墙」和「GPT-3完全没意义」等观点,反对炒作AI。

也有网友对下一代模型的潜在「威力」,表示了担心:

「如果这是真的,那『他』的智商,至少已经达到了100。」

「这将是历史上最伟大的技术革命之一,但社会需要立即重视起来。因为『他』的可应用潜力是无限的。」


相关文章
|
4月前
|
人工智能 搜索推荐 测试技术
模拟试错(STE)法让7B大模型测试超GPT-4
【2月更文挑战第24天】模拟试错(STE)法让7B大模型测试超GPT-4
99 1
模拟试错(STE)法让7B大模型测试超GPT-4
|
11天前
|
人工智能 API Python
Openai python调用gpt测试代码
这篇文章提供了使用OpenAI的Python库调用GPT-4模型进行聊天的测试代码示例,包括如何设置API密钥、发送消息并接收AI回复。
|
19天前
|
缓存 测试技术 C++
OpenAI GPT-4 Code Interpreter测试
本文分析了OpenAI GPT-4 Beta版本中的Code Interpreter功能,测试了其处理不同文件类型(如图表PNG、长文本PDF、短代码ipynb和长代码C++)的能力,并指出了在处理超出Token Limit内容时的局限性。
26 0
OpenAI GPT-4 Code Interpreter测试
|
2月前
|
人工智能 自然语言处理 测试技术
这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于视力测试
【7月更文挑战第28天】新研究表明VLM在简单视觉任务上的局限性。论文《Vision language models are blind》指出, GPT-4o、Claude-3.5 Sonnet等顶级模型在如判断形状重叠或字母识别等基本任务上表现不佳。另一研究在CVPR'24上介绍了一个新框架, 利用TRUMANS数据集生成精细的人物动作, 包括手部运动, 显示出在复杂场景下的强大能力, 尽管仍面临一定的局限。[论文链接](https://arxiv.org/pdf/2407.06581) [TRUMANS](https://arxiv.org/pdf/2403.08629)
19 4
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|
4月前
|
人工智能 自然语言处理 安全
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
【5月更文挑战第27天】GPT-4在图灵测试中达到54%的胜率,使人类无法辨别其身份,展示出强大的人工智能模拟人类行为的能力。这项由UCSD进行的研究超越了ELIZA的22%,但未及人类67%的真实水平。尽管成果显著,图灵测试的局限性及AI伦理问题也随之浮现,引发关于技术控制与安全性的讨论。该进展预示着人工智能在客户服务等领域有广阔应用前景。[[arXiv:2405.08007](https://arxiv.org/pdf/2405.08007)]
40 1
|
4月前
|
人工智能 数据安全/隐私保护
图灵测试
图灵测试 “【5月更文挑战第20天】”
74 1
|
3月前
|
测试技术
软件测试之【合理的利用GPT来辅助软件测试一】
软件测试之【合理的利用GPT来辅助软件测试一】
48 0
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI Business Model】人工智能的定义 | 了解 AI 的历史 | 简单理解什么是 “图灵测试“
【AI Business Model】人工智能的定义 | 了解 AI 的历史 | 简单理解什么是 “图灵测试“
117 1
|
4月前
|
人工智能 测试技术 量子技术
Claude 3智商测试101分超越人类/碾压GPT-4!
【2月更文挑战第16天】Claude 3智商测试101分超越人类/碾压GPT-4!
56 1
Claude 3智商测试101分超越人类/碾压GPT-4!