如何本地跑通一个大模型

简介: 这里主要借助两个开源项目 [ollama](https://github.com/ollama/ollama) 和 [openwebui](https://github.com/open-webui/open-webui) 这两个项目,来尝试本地跑通`llama3.1 8b` 、 `mistral-nemo 12b` 和 `qwen2 7b` 这些模型,再大的模型机器也撑不住了。

前言

这里主要借助两个开源项目 ollamaopenwebui 这两个项目,来尝试本地跑通llama3.1 8bmistral-nemo 12bqwen2 7b 这些模型,再大的模型机器也撑不住了,机器配置如下:

CPU: M2 Max

内存:32 GB

内容

ollamahttps://ollama.com/

ollama GitHubhttps://github.com/ollama/ollama

ollama Modelshttps://ollama.com/library

openwebuihttps://openwebui.com/

openwebui GitHubhttps://github.com/open-webui/open-webui

安装ollama

访问 ollama 网站,根据自身的平台来下载应用,下载后正常安装即可,安装完成后运行命令来拉取模型,模型可访问 ollama Models 选择相应的模型后,会有对应的命令,终端执行即可。

## llama3.1
$ ollama run llama3.1:8b

## qwen2.5
$ ollama run qwen2.5:7b

## mistral-nemo
$ ollama run mistral-nemo:12b

安装openwebui

因为我的 ollama 是在本地的,所以我这里直接基于 docker 来运行 openwebui,运行命令如下:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

运行成功后,我们访问 127.0.0.1:3000 即可打开本地的聊窗口,创建好对应的账号登录后,访问界面如下:
image-20240923175135700.pngimage-20240923175135700.png

总结

总的来说,现在基于开源的项目,我们能够很快的搭建一个自己本地使用的模型,当前如果你不存在数据安全的问题,使用国内或国外的最新的大模型体验肯定更好。

尝试跑了下llama3.1 70b的模型,跑起来后内存直线飙升,32GB内存的机器不建议尝试跑70b

目录
相关文章
|
6月前
|
机器学习/深度学习 编解码 自然语言处理
腾讯混元 HunyuanVideo 1.5 开源!
腾讯混元团队开源HunyuanVideo 1.5,一款8.3B参数的轻量级视频生成模型,基于DiT架构,支持文生视频、图生视频,可在14G显存设备运行,生成5-10秒高清视频,具备强指令响应、流畅动作与电影级画质。
1568 10
腾讯混元 HunyuanVideo 1.5 开源!
|
4月前
|
人工智能 小程序 JavaScript
微信小程序的开发流程
微信小程序开发流程成熟高效,依托云开发与AI辅助,大幅缩短上线周期。涵盖资质准备、需求设计、技术选型、编码实现、测试调试到发布审核六大阶段,并强调合规性、插件复用与AI提效,助力快速落地优质应用。(239字)
|
6月前
|
机器学习/深度学习 人工智能 前端开发
终端里的 AI 编程助手:OpenCode 使用指南
OpenCode 是开源的终端 AI 编码助手,支持 Claude、GPT-4 等模型,可在命令行完成代码编写、Bug 修复、项目重构。提供原生终端界面和上下文感知能力,适合全栈开发者和终端用户使用。
53192 11
|
人工智能 Java 程序员
一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型
本文介绍如何本地化部署DeepSeek大模型(deepseek-r1)及open-webui的安装过程,包括命令行操作、版本兼容性处理等详细步骤。DeepSeek号称“国运级”大模型,性能媲美OpenAI,支持直接对话,降低使用门槛。通过本教程,读者可以快速上手体验这一强大的推理模型。
1363 0
一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型
|
10月前
|
人工智能 缓存 数据可视化
手把手玩转本地大模型:Ollama+DeepSeek+Dify 零门槛全流程指南
本文提供从零搭建本地AI工作站的完整指南,详解本地化部署大模型的核心优势(数据隐私/离线可用/成本可控),涵盖Ollama安装、DeepSeek-Coder模型部署、Dify可视化操作及API调用实战,助你打造安全高效的私有AI开发环境。
|
Linux 开发者 iOS开发
|
JavaScript
Vue3评分(Rate)
这是一个基于 Vue 3 的评分组件 `Rate.vue`,支持多种自定义设置,包括是否允许清除、半选状态、星星总数、字符样式、字符大小、选中颜色、字符间距及是否禁用等。组件内置四种 SVG 图标,并允许使用自定义字符。通过 `v-model:value` 实现双向绑定,并提供了 `change` 和 `hoverChange` 事件回调。 组件演示了不同的使用场景,如禁用状态、不同形状的图标、自定义字符和颜色等。同时提供了一个评分配置器,可以动态调整各项参数以满足不同需求。在线预览效果展示了各种配置下的评分显示样式。
476 1
Vue3评分(Rate)
|
人工智能 API Windows
免费部署本地AI大语言模型聊天系统:Chatbox AI + 马斯克grok2.0大模型(简单5步实现,免费且比GPT4.0更好用)
本文介绍了如何部署本地AI大语言模型聊天系统,使用Chatbox AI客户端应用和Grok-beta大模型。通过获取API密钥、下载并安装Chatbox AI、配置模型,最终实现高效、智能的聊天体验。Grok 2大模型由马斯克X-AI发布,支持超长文本上下文理解,免费且易于使用。
|
网络安全 数据安全/隐私保护 网络架构

热门文章

最新文章