苹果加入开源大战,官宣端侧小模型OpenELM!参数2.7亿到30亿一台M2 Mac可跑

简介: 【5月更文挑战第10天】苹果开源高效语言模型OpenELM,采用层级缩放策略,参数量2.7亿至30亿,可在M2 Mac上运行。相比OLMo,OpenELM在10亿参数下精度提升2.36%,只需一半预训练标记。苹果提供了完整的训练、评估框架及设备推理代码,促进开放研究,源代码和模型可在项目网站及HuggingFace找到。然而,OpenELM尚处早期阶段,性能有待验证,且苹果保留知识产权。论文链接:https://arxiv.org/abs/2404.14619

随着人工智能的不断发展,语言模型在各个领域的应用越来越广泛。然而,大型语言模型的可复制性和透明度对于推动开放研究、确保结果的可信度以及研究数据和模型的偏见和潜在风险至关重要。为了解决这个问题,苹果公司最近宣布了OpenELM,一个开源的高效语言模型家族。

OpenELM采用了一种层级缩放策略,通过在Transformer模型的每个层中有效地分配参数,实现了增强的准确性。例如,在大约10亿参数的预算下,OpenELM的准确性比OLMo提高了2.36%,同时只需要一半的预训练标记。

与之前只提供模型权重和推理代码,并在私有数据集上进行预训练的做法不同,苹果的发布包括了在公共可用数据集上进行语言模型的完整训练和评估框架,包括训练日志、多个检查点和预训练配置。此外,他们还发布了将模型转换为MLX库以在苹果设备上进行推理和微调的代码。

这一全面的发布旨在赋予和加强开放研究社区的能力,为未来的开放研究铺平道路。OpenELM的源代码、预训练模型权重和训练配方可以在他们的网站上找到。此外,OpenELM模型也可以在HuggingFace上找到。

OpenELM的发布对于那些对在苹果设备上运行高效语言模型感兴趣的人来说是一个令人兴奋的消息。然而,值得注意的是,OpenELM仍然是一个相对较新的模型,可能需要更多的研究和测试来确定其在各种应用中的性能。此外,尽管OpenELM是开源的,但苹果公司仍然拥有对该模型的知识产权,这可能会限制其他组织对该模型的使用和修改。

论文地址:https://arxiv.org/abs/2404.14619

目录
相关文章
|
3月前
|
【10月更文挑战第7天】「Mac上学Python 15」小学奥数篇1 - 如何平分6个苹果和4个橘子
本篇将通过 Python 和 Cangjie 双语讲解一个简单的数学题:如何平分 N 个苹果和 M 个橘子。这道题旨在锻炼初学者的逻辑思维,并学会使用编程解决实际问题。
126 1
【10月更文挑战第7天】「Mac上学Python 15」小学奥数篇1 - 如何平分6个苹果和4个橘子
Mac M1/M2/M3 芯片环境配置以及常用软件安装-前端
Mac M1/M2/M3 芯片环境配置以及常用软件安装-前端 最近换了台新 Mac,所有的配置和软件就重新安装下,顺便写个文章。
704 1
HBuilderX使用mac打包ios应用提示苹果根证书没有安装
HBuilderX使用mac打包ios应用提示苹果根证书没有安装
154 0
制作苹果研发者证书和MAC的CSR证书
制作苹果研发者证书和MAC的CSR证书
205 0
苹果mac系统音频播放软件哪个好一点
在苹果mac系统上,有许多不同的音频播放软件可供选择,这些软件各有优点和适用场景。下面将为您详细介绍每一个软件,帮助您找到最适合您的音频播放器。
482 1
苹果mac系统音频播放软件哪个好一点
mac/苹果上面js对比(运算)失效怎么处理?
mac/苹果上面js对比(运算)失效怎么处理?
52 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等