OpenAI CEO:巨型AI模型时代已结束,马斯克TruthGPT曝光

简介: OpenAI CEO:巨型AI模型时代已结束,马斯克TruthGPT曝光


编辑:陈萍、杜伟

至于原因,一方面是大模型需要跳出扩展参数规模的范畴,另一方面受限于高昂的训练成本。


近几个月来,OpenAI ChatGPT 的强大生成式对话能力引发了人们对 AI 的新兴趣和投资。随着国内外掀起类 ChatGPT 研发热潮,对话式 AI 及背后的大模型被更多人看好。

但上周在 MIT 的视频发言中,OpenAI CEO Sam Altman 发表了另一番言论。他警告称,诞生 ChatGPT 的研究策略已经结束。至于未来会在哪些方面出现进展尚不清楚。

过去几年,OpenAI 通过采用现有机器学习算法并将它们扩展到以往无法想象的规模,在与语言相关的人工智能领域取得了一系列引人瞩目的进展。其中作为最新的进展,GPT-4 可能使用数万亿文本单词和数千个强大的计算机芯片训练。

GPT-4 在语言、数学、编程、视觉、医学、法律和心理学等多种任务上都有出色的表现。Sam Altman 却对此表示,让模型变得更大(比如巨型模型)将不会进一步带来新进展

Sam Altman 的这番言论表明,在开发和部署新 AI 算法的竞赛中出现了一个意想不到的转折。自去年 11 月 ChatGPT 推出以来,微软利用底层技术在必应搜索中添加了基于它的聊天机器人,谷歌也推出 Bard 竞品。很多人急着尝试使用新型聊天机器人帮助完成工作或个人任务。

与此同时,包括 Anthropic、AI21、Cohere 和 Character.AI 在内众多资金雄厚的初创公司都投入大量资源构建规模更大的算法,以努力追赶 OpenAI。

不过,Sam Altman 的话似乎预示着,GPT-4 可能是 OpenAI 研发更大模型并喂给它们更多数据这一战略的最后一个重大进展。这也可以从他亲自辟谣 GPT-5 的相关传闻中看出一些端倪,他表示目前没有训练 GPT-5,短期内也不会训练

在描述 GPT-4 的论文中,OpenAI 预估扩展模型规模的收益将出现递减。OpenAI 建造数据中心的数量以及建造速度也存在物理限制。

除了大模型设计和架构本身的原因,巨额花费也是一大原因。据报道,ChatGPT 需要至少 10000 个 GPU 进行训练,还需要更多资源保证持续运行。而英伟达专为 AI 和高性能计算设计的最新 H100 GPU 单价高达 30,603 美元,无疑成本高昂。Altman 亲自承认,GPT-4 的训练花费超过了 1 亿美元

Cohere 的联合创始人(曾在谷歌从事 AI 工作)Nick Frosst 表示,Altman 的扩大规模并不能永远奏效的观点听起来是对的。他也认为,Transformer(GPT-4 及竞品的核心机器学习模型类型)的进展已经超出了扩展范畴。除了向模型添加更多参数之外,还有很多其他方法可以使 Transformer 变得更好、更有用。

新的 AI 模型设计或架构以及基于人类反馈的进一步微调成为很多研究人员已经在探索的有前景的方向。

马斯克将 AI 项目命名为 TruthGPT

马斯克这边,虽然嘴上说担忧 GPT-4 引发社会问题,并签署暂停开发比 GPT-4 更强大的系统至少六个月。但实际情况却是马斯克正致力于新建一家人工智能初创公司 X.AI,与 OpenAI 直接展开竞争。

据报道,马斯克已经从英伟达获取了上万块 GPU,这些系统为人工智能和高端图形处理等密集型任务所需的计算提供动力。

马斯克证实了有关他计划创建一家人工智能初创公司,与 ChatGPT 竞争的报道。马斯克在接受福克斯采访时宣布了这项计划,并表示,「我将创建一种称为 TruthGPT 的人工智能平台,或者说是一个最大限度地寻求真理的人工智能,可以理解宇宙的本质。我认为这可能是通往(AI)安全的最佳途径,从某种意义上说,一个关心理解宇宙的人工智能不太可能灭绝人类,因为我们是宇宙中有趣的一部分。」

马斯克在采访中还表示,他相信人工智能具有毁灭文明的潜力,无论(其力量)多么小。

此前,马斯克于 2015 年与 OpenAI 现任 CEO Sam Altman 等人共同创立了 OpenAI,但马斯克于 2018 年离开了公司董事会。据了解,马斯克当时声明的原因是为了避免与特斯拉发生潜在的利益冲突,但后来马斯克表示还有其他原因,另一个原因是他不同意 OpenAI 团队在做的一些事情。

另外据 Semafor  3 月份报道,马斯克曾试图在 2018 年接任公司 CEO 一职,但在 Altman 和其他人拒绝后便离开了。

自从退出 OpenAI 董事会以来,马斯克一再批评 OpenAI。就在今年 2 月,他还表示现在的 OpenAI 根本不是他所希望的,并称 OpenAI 为微软控制的、闭源、利润最大化的公司」。

面多马斯克的多次攻击,Altman 表示即便如此,自己仍将马斯克视为自己的偶像之一,并表示,「我相信马斯克确实对 AGI 安全感到压力,这是可以理解的。」

值得一提的是这不是马斯克第一次考虑打造 TruthGPT。他在 2 月曾经发推说,我们需要的是 TruthGPT。

关于 TruthGPT 的更多细节,马斯克没有透漏更多消息,我们可以后续期待一波。

参考链接:https://www.wired.com/story/openai-ceo-sam-altman-the-age-of-giant-ai-models-is-already-over/https://venturebeat.com/ai/openai-chief-says-age-of-giant-ai-models-is-ending-a-gpu-crisis-could-be-one-

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
32 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
13天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
83 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
15天前
|
人工智能 数据可视化 JavaScript
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
NodeTool 是一个开源的 AI 工作流可视化构建器,通过拖放节点的方式设计复杂的工作流,无需编码即可快速原型设计和测试。它支持本地 GPU 运行 AI 模型,并与 Hugging Face、OpenAI 等平台集成,提供模型访问能力。
90 14
NodeTool:AI 工作流可视化构建器,通过拖放节点设计复杂的工作流,集成 OpenAI 等多个平台
|
7天前
|
人工智能 自然语言处理 并行计算
ASAL:Sakana AI 联合 OpenAI 推出自动探索人工生命的系统,通过计算机模拟生命进化的过程
ASAL 是由 Sakana AI 联合 OpenAI 等机构推出的自动化搜索人工生命系统,基于基础模型实现多种搜索机制,扩展了人工生命研究的边界。
58 1
ASAL:Sakana AI 联合 OpenAI 推出自动探索人工生命的系统,通过计算机模拟生命进化的过程
|
22天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
74 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
24天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
65 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
23天前
|
人工智能 编解码 机器人
OpenAI又出王炸了!正式推出超强AI视频模型Sora
OpenAI正式推出AI视频生成模型Sora,可根据文本提示生成逼真视频,面向美国及其他市场ChatGPT付费用户开放。Sora Turbo支持生成长达20秒的视频及多种变体,具备模拟物理世界的新兴能力,可创建多镜头视频,提供Remix和Storyboard等创新功能。
53 4
OpenAI又出王炸了!正式推出超强AI视频模型Sora
|
10天前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
53 13
|
7天前
|
人工智能 自然语言处理 机器人
OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro
OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro
|
12天前
|
人工智能 自然语言处理 前端开发
openai 12天发布会收官 | AI大咖说
OpenAI这12天的发布会,并没有太多特别令人惊喜的内容,可能是前面的惊喜太多了。更多的是,让ChatGPT越来越侧重参与现实中的应用,真正赋能改变生活,包括projects项目管理,canvas文档写作,接入电话,接入ios,接入桌面,接入搜索,以及chatGPT桌面和更多应用的交互。 以及更多的多模态的延展,视觉vision,语音,视频sora。 在最后收官中,宣布新一代的O3和O3-mini更强的推理模型
106 11