llama.cpp作者创业，用纯C语言框架降低大模型运行成本-阿里云开发者社区

llama.cpp作者创业，用纯C语言框架降低大模型运行成本

2023-06-30 686

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： llama.cpp作者创业，用纯C语言框架降低大模型运行成本

大模型的应用前景将越来越广泛。

通常，神经网络的推理代码是使用 Python 语言编写的。但相比于 Python，C/C++ 代码运行速度更快，编写过程更严谨，因此一些开发者尝试用 C/C++ 语言实现神经网络。

在众多使用 C/C++ 语言编写神经网络代码的开发者中，Georgi Gerganov 是一位佼佼者。Georgi Gerganov 是资深的开源社区开发者，曾为 OpenAI 的 Whisper 自动语音识别模型开发 whisper.cpp。

Georgi Gerganov

今年 3 月 Georgi Gerganov 又构建了开源项目 llama.cpp，llama.cpp 让开发者在没有 GPU 的条件下也能运行 Meta 的 LLaMA 模型。llama.cpp 让开发者在没有 GPU 的条件下也能运行 LLaMA 模型。项目发布后，很快就有开发者尝试并成功在 MacBook 和树莓派上运行 LLaMA。

打开 Georgi Gerganov 的个人主页，我们发现全是开源项目，满满的干货。