最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

作为史上最受期待的AI模型,GPT-4真要来了?

这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。

他表示,「GPT-4几乎准备就绪,并将于今年12月至明年2月的某个时间点发布」

甚至还有传言表示,GPT-4已经先进到「与人类无异」,甚至通过了图灵测试。和以前相比,企业引进成本也将大幅下降。

目前,整个AI界还没有出现「正式且肯定」能通过图灵测试的模型,因此GPT-4的推出——很可能成就AI史上又一个伟大的一年。

最快下月,第四代模型真快来了?


2020年6月,由埃隆·马斯克等人创立的世界级人工智能研究机构OpenAI发布了第三代生成式预训练模型GPT-3。

GPT-3拥有1750亿个参数,是上一代模型GPT-2的100倍,也一举将此前同类NLP模型的参数纪录提升了10倍。

GPT-3的发布被业界视为重大进展,也因此被《麻省理工科技评论》列为「2021十大突破性技术」。

巨大的性能飞跃,也让所有人对OpenAI的下一代生成式预训练模型寄予厚望。

假如GPT-4之于GPT-3的进步,就像GPT-3之于GPT-2一样大,那么这又将是一个接近100倍的提升。

但近两年来,OpenAI在谈及GPT-4时却一向非常「腼腆」,甚至可以说大多数时间都保持着沉默。我们仅能从管理层不经意间透露出的零星信息「管中窥豹」。

距离上一次GPT-4有消息流出,这还要追溯到今年年初。

当时OpenAI的首席执行官萨姆·阿尔特曼(Sam Altman)表示,GPT-4预计将在今年7月至8月发布。

然而近期,美国科技博主罗伯特·斯科布尔(Robert Scoble)却表示:

「颠覆即将来临。GPT-4比任何人的预期都要出类拔萃。它是将于明年推出的几大AI产品之一。」

Cambrian AI公司分析师阿尔贝托·罗梅罗(Alberto Romero)也在《算法桥》的专栏文章中,援引了硅谷工程师伊戈尔-拜科夫(Igor Baikov)9月时的一条推文:

「OpenAI已经在训练GPT-4,并计划于12月-2月间发布。」

此外,包含1.17亿个参数的第一代GPT,于2018年发布;2019年和2020年,我们分别迎来了GPT-2和GPT-3。

已然「矜持」了一年有余的OpenAI——或许也是时候推陈出新了。

「GPT-4能通过图灵测试,我不会惊讶」


对于GPT-4,一位AI创业公司的代表分析称,「GPT-4轻松通过了图灵测试,或间接表明性能足够高,已具备通过图灵测试的潜力。」

OpenAI CEO阿尔特曼近期的一篇推文,似乎也曾侧面印证了这个传闻。

他上传了一张星球大战的照片,上面写着一句话:

「不要为自己创造的『技术恐怖』而骄傲,通过图灵测试的能力在『原力』面前无能为力。」

这是对电影星球大战系列中著名角色达斯-维德 (Darth Vader) 经典台词的模仿。

罗梅罗也在文章中表示:

「如果GPT-4能充分通过图灵测试,我不会感到惊讶。」

图灵测试是一种检测方式,旨在了解计算机与人类交流的自然程度。

目前,AI界还没有「正式且肯定」通过图灵测试的AI模型。

尽管过去有一些人工智能模型声称已经通过了图灵测试,但因为其标准和规则并不明确,所以他们使用了一些「盲点」,并非全局通过了测试。

假如传闻是真的,GPT-4能不受限制地通过图灵测试,那它将成为当之无愧的「历史第一」

训练成本显著降低,商业化潜力巨大


AI圈对GPT-4的广泛关注还有一个原因:据说未来商业服务引入GPT-4的实际门槛,将远低于现有的GPT-3模型。

与此同时,预计由于巨大的成本和所需要的基础设施而无法使用AI技术的公司,也将有更多的空间使用GPT-4。

根据罗梅罗的预测,OpenAI将下一代模型的重点更多地放在优化数据处理上,而不是参数大小上,因此GPT-4的规模很可能与GPT-3相似。

到目前为止,人工智能技术的进步和模型尺寸的扩展是一起进行的,但近期为轻量化模型增加功能被认为是很有前景的。

GPT-4的模型训练成本有望比以前更低。罗梅罗写道,「GPT-4的训练成本预计将显著低于GPT-3」。

众所周知,GPT-3仅在学习阶段每节课就要花费数十万。这也是为什么大公司无法轻而易举为普通用户发布基于GPT-3的人工智能服务。

在韩国,仅有SK Telecom公司的的个人人工智能服务「Adot」基于GPT-3。

罗梅罗还表示,GPT-4的每次训练成本有望降至100万美元以下。

一位ICT公司官员表示:

「如果所有已知的信息都是真的,那么明年将会出现几种聊天机器人服务。它们是如此自然,以至于用户不知道他们是在与人交谈还是在与计算机交谈。」

「人工智能服务可能会增加。」

网友:需要警惕


对于OpenAI的下一代「灭霸」级模型,不少网友纷纷表示「太期待了」。

然而,著名AI学者、Robust.AI的创始人兼CEO盖瑞·马库斯(Gary Marcus)却再次唱衰了GPT-4的前景。

他在社媒表示:「有传言说GPT-4即将到来。下面我的预测:它仍然会存在严重的虚构/错误信息、毒性和偏见问题。」

马库斯对AI行业的关注众所周知,但也发表过许多诸如「深度学习撞墙」和「GPT-3完全没意义」等观点,反对炒作AI。

也有网友对下一代模型的潜在「威力」,表示了担心:

「如果这是真的,那『他』的智商,至少已经达到了100。」

「这将是历史上最伟大的技术革命之一,但社会需要立即重视起来。因为『他』的可应用潜力是无限的。」


相关文章
|
2月前
|
人工智能 自然语言处理 测试技术
用图灵测试检验AI尤其是大语言模型,真的科学吗?
【9月更文挑战第25天】《Does GPT-4 Pass the Turing Test?》一文评估了先进AI模型GPT-4的图灵测试表现。尽管GPT-4在某些对话中成功迷惑了参与者,但其整体成功率仅为41%,低于人类的63%。图灵测试作为评估AI语言能力的工具依然有效,但存在局限性,如无法评估AI的认知机制且受主观判断影响。此外,测试还引发了关于AI智能及伦理的讨论。
162 6
|
1月前
|
人工智能
反向和错位图灵测试:GPT-4比人类更人性化!
【10月更文挑战第8天】本文探讨了GPT-4在反向和错位图灵测试中的表现。反向测试中,GPT-4判断自身生成对话的准确性高于判断人类对话;错位测试中,人类更容易区分GPT-4生成的对话。研究揭示了GPT-4的某些特征及其局限性,如数据集偏差和任务特定性。
23 5
|
1月前
|
机器学习/深度学习 测试技术
ACL杰出论文奖:GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集,全面提升大模型心智能力
【10月更文挑战第6天】约翰斯·霍普金斯大学等机构提出了一项荣获ACL杰出论文奖的研究,旨在解决大模型在心智理论(ToM)上的不足。他们发布了首个MMToM-QA多模态ToM测试集,并提出BIP-ALM方法,从多模态数据中提取统一表示,结合语言模型进行贝叶斯逆规划,显著提升了模型的ToM能力。这一成果为机器与人类自然交互提供了新思路,尽管仍面临一些局限性和技术挑战。论文详情见:https://arxiv.org/abs/2401.08743。
47 6
|
1月前
|
API
2024-05-14 最新!OpenAI 新模型 GPT-4 omni 简单测试,4o速度确实非常快!而且很便宜!
2024-05-14 最新!OpenAI 新模型 GPT-4 omni 简单测试,4o速度确实非常快!而且很便宜!
41 0
|
3月前
|
人工智能 API Python
Openai python调用gpt测试代码
这篇文章提供了使用OpenAI的Python库调用GPT-4模型进行聊天的测试代码示例,包括如何设置API密钥、发送消息并接收AI回复。
|
3月前
|
缓存 测试技术 C++
OpenAI GPT-4 Code Interpreter测试
本文分析了OpenAI GPT-4 Beta版本中的Code Interpreter功能,测试了其处理不同文件类型(如图表PNG、长文本PDF、短代码ipynb和长代码C++)的能力,并指出了在处理超出Token Limit内容时的局限性。
51 0
OpenAI GPT-4 Code Interpreter测试
|
4月前
|
人工智能 自然语言处理 测试技术
这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于视力测试
【7月更文挑战第28天】新研究表明VLM在简单视觉任务上的局限性。论文《Vision language models are blind》指出, GPT-4o、Claude-3.5 Sonnet等顶级模型在如判断形状重叠或字母识别等基本任务上表现不佳。另一研究在CVPR'24上介绍了一个新框架, 利用TRUMANS数据集生成精细的人物动作, 包括手部运动, 显示出在复杂场景下的强大能力, 尽管仍面临一定的局限。[论文链接](https://arxiv.org/pdf/2407.06581) [TRUMANS](https://arxiv.org/pdf/2403.08629)
43 4
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|
6月前
|
人工智能 自然语言处理 安全
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
【5月更文挑战第27天】GPT-4在图灵测试中达到54%的胜率,使人类无法辨别其身份,展示出强大的人工智能模拟人类行为的能力。这项由UCSD进行的研究超越了ELIZA的22%,但未及人类67%的真实水平。尽管成果显著,图灵测试的局限性及AI伦理问题也随之浮现,引发关于技术控制与安全性的讨论。该进展预示着人工智能在客户服务等领域有广阔应用前景。[[arXiv:2405.08007](https://arxiv.org/pdf/2405.08007)]
75 1
|
6月前
|
人工智能 数据安全/隐私保护
图灵测试
图灵测试 “【5月更文挑战第20天】”
254 1

热门文章

最新文章