马斯克旗下公司宣布开源 Grok-1 模型，参数量达3140亿-阿里云开发者社区

马斯克旗下公司宣布开源 Grok-1 模型，参数量达3140亿

2024-03-19 211

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 最近，Meta基础人工智能研究（FAIR）团队发布了名为Branch-Train-MiX (BTX)的方法，可从种子模型开始，该模型经过分支，以高吞吐量和低通信成本的并行方式训练专家模型。Meta FAIR的成员之一Jason Weston在其X上发文介绍了这一进展。

北京时间3月18日凌晨，马斯克旗下的人工智能初创公司xAI正式宣布开源大模型Grok-1，遵循Apache 2.0协议开放模型权重和架构。xAI官网显示，xAI已经将Grok-1的权重和架构在软件托管平台GitHub上开源。

官网介绍，Grok-1是3140亿参数的混合专家模型，这也让Grok-1成为迄今参数量最大的开源大语言模型，是Llama 2的4倍。相比之下，公开资料显示，OpenAI GPT-3.5的参数量为1750亿，Grok-1大幅领先。

2023 年 11 月，马斯克旗下的人工智能公司 xAI 发布了首款 AI 聊天产品，取名为 “Grok”。Grok 的名字来自罗伯特・安森・海因莱因的科幻小说《异乡异客》，意思是完全理解某事或某人。Grok 具备以下特点：

马斯克表示，xAI将在GitHub上开源它的人工智能聊天机器人Grok，这将允许研究人员和开发人员在该模型的基础上对它进行开发，并能进一步影响Grok的下一步更新。

马斯克旗下公司宣布开源 Grok-1 模型，参数量达3140亿