苹果加入开源大战，官宣端侧小模型OpenELM！参数2.7亿到30亿一台M2 Mac可跑-阿里云开发者社区

苹果加入开源大战，官宣端侧小模型OpenELM！参数2.7亿到30亿一台M2 Mac可跑

2024-05-11 132

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【5月更文挑战第10天】苹果开源高效语言模型OpenELM，采用层级缩放策略，参数量2.7亿至30亿，可在M2 Mac上运行。相比OLMo，OpenELM在10亿参数下精度提升2.36%，只需一半预训练标记。苹果提供了完整的训练、评估框架及设备推理代码，促进开放研究，源代码和模型可在项目网站及HuggingFace找到。然而，OpenELM尚处早期阶段，性能有待验证，且苹果保留知识产权。论文链接：https://arxiv.org/abs/2404.14619

随着人工智能的不断发展，语言模型在各个领域的应用越来越广泛。然而，大型语言模型的可复制性和透明度对于推动开放研究、确保结果的可信度以及研究数据和模型的偏见和潜在风险至关重要。为了解决这个问题，苹果公司最近宣布了OpenELM，一个开源的高效语言模型家族。

OpenELM采用了一种层级缩放策略，通过在Transformer模型的每个层中有效地分配参数，实现了增强的准确性。例如，在大约10亿参数的预算下，OpenELM的准确性比OLMo提高了2.36%，同时只需要一半的预训练标记。

与之前只提供模型权重和推理代码，并在私有数据集上进行预训练的做法不同，苹果的发布包括了在公共可用数据集上进行语言模型的完整训练和评估框架，包括训练日志、多个检查点和预训练配置。此外，他们还发布了将模型转换为MLX库以在苹果设备上进行推理和微调的代码。

这一全面的发布旨在赋予和加强开放研究社区的能力，为未来的开放研究铺平道路。OpenELM的源代码、预训练模型权重和训练配方可以在他们的网站上找到。此外，OpenELM模型也可以在HuggingFace上找到。

OpenELM的发布对于那些对在苹果设备上运行高效语言模型感兴趣的人来说是一个令人兴奋的消息。然而，值得注意的是，OpenELM仍然是一个相对较新的模型，可能需要更多的研究和测试来确定其在各种应用中的性能。此外，尽管OpenELM是开源的，但苹果公司仍然拥有对该模型的知识产权，这可能会限制其他组织对该模型的使用和修改。

论文地址：https://arxiv.org/abs/2404.14619

苹果加入开源大战，官宣端侧小模型OpenELM！参数2.7亿到30亿一台M2 Mac可跑

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

苹果加入开源大战，官宣端侧小模型OpenELM！参数2.7亿到30亿一台M2 Mac可跑

热门文章

最新文章

相关课程

相关电子书