如何本地跑通一个大模型

简介: 这里主要借助两个开源项目 [ollama](https://github.com/ollama/ollama) 和 [openwebui](https://github.com/open-webui/open-webui) 这两个项目,来尝试本地跑通`llama3.1 8b` 、 `mistral-nemo 12b` 和 `qwen2 7b` 这些模型,再大的模型机器也撑不住了。

前言

这里主要借助两个开源项目 ollamaopenwebui 这两个项目,来尝试本地跑通llama3.1 8bmistral-nemo 12bqwen2 7b 这些模型,再大的模型机器也撑不住了,机器配置如下:

CPU: M2 Max

内存:32 GB

内容

ollamahttps://ollama.com/

ollama GitHubhttps://github.com/ollama/ollama

ollama Modelshttps://ollama.com/library

openwebuihttps://openwebui.com/

openwebui GitHubhttps://github.com/open-webui/open-webui

安装ollama

访问 ollama 网站,根据自身的平台来下载应用,下载后正常安装即可,安装完成后运行命令来拉取模型,模型可访问 ollama Models 选择相应的模型后,会有对应的命令,终端执行即可。

## llama3.1
$ ollama run llama3.1:8b

## qwen2.5
$ ollama run qwen2.5:7b

## mistral-nemo
$ ollama run mistral-nemo:12b
AI 代码解读

安装openwebui

因为我的 ollama 是在本地的,所以我这里直接基于 docker 来运行 openwebui,运行命令如下:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
AI 代码解读

运行成功后,我们访问 127.0.0.1:3000 即可打开本地的聊窗口,创建好对应的账号登录后,访问界面如下:
image-20240923175135700.pngimage-20240923175135700.png

总结

总的来说,现在基于开源的项目,我们能够很快的搭建一个自己本地使用的模型,当前如果你不存在数据安全的问题,使用国内或国外的最新的大模型体验肯定更好。

尝试跑了下llama3.1 70b的模型,跑起来后内存直线飙升,32GB内存的机器不建议尝试跑70b

目录
打赏
0
11
12
0
67
分享
相关文章
你体验过让大模型自己写代码、跑代码吗?
通义千问在代码编写和运行上展现不俗实力,尤其擅长处理简单逻辑和算法,能将自然语言转化为可执行代码,助力快速原型设计。然而,面对复杂任务和专业领域知识时,其表现有待提升。优化策略包括细化需求、提供示例代码、迭代反馈和结合领域知识。随着持续优化,未来编程助手将更智能高效。
腾讯开源HunyuanVideo-I2V图生视频模型+LoRA训练脚本,社区部署、推理实战教程来啦!
继阿里的通义万相wan2.1模型之后,腾讯混元又出大招,重磅发布HunyuanVideo-I2V图生视频模型。
118 9
AI大模型复习“搭子”—部署流程演示
本文主要介绍文档智能,介绍利用大模型构建知识库和AI学习助手的部署流程,主要包括以下几方面的内容: 1.什么是文档智能 2.文档智能 & RAG 3.基于文档智能和百炼平台的RAG应用案例
104 3
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
在 Qwen2 发布后的过去三个月里,许多开发者基于 Qwen2 语言模型构建了新的模型,并提供了宝贵的反馈。在这段时间里,通义千问团队专注于创建更智能、更博学的语言模型。今天,Qwen 家族的最新成员:Qwen2.5系列正式开源
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
蚂蚁 CodeFuse 代码大模型技术解析:基于全仓库上下文的代码补全
CodeFuse 代码补全插件是 CodeFuse 系列产品中用户数量最多、留存率最大,调用AI能力最多的产品~欢迎大家体验试用https://github.com/codefuse-ai/RepoFuse
1298 7
蚂蚁 CodeFuse 代码大模型技术解析:基于全仓库上下文的代码补全
使用Python实现深度学习模型:模型部署与生产环境应用
【7月更文挑战第7天】 使用Python实现深度学习模型:模型部署与生产环境应用
330 0
Prompt工程全攻略:15+Prompt框架一网打尽(BROKE、COAST、LangGPT)、学会提示词让大模型更高效
Prompt工程全攻略:15+Prompt框架一网打尽(BROKE、COAST、LangGPT)、学会提示词让大模型更高效
Prompt工程全攻略:15+Prompt框架一网打尽(BROKE、COAST、LangGPT)、学会提示词让大模型更高效
你体验过让大模型自己写代码、跑代码吗?
【4月更文挑战第10天】你体验过让大模型自己写代码、跑代码吗?