手把手教你用 Ollama 在本地部署大模型:无需 GPU,10 分钟跑通 Llama 3!

简介: 想本地运行Llama 3、Mistral、Gemma、Qwen等开源大模型?Ollama一键部署,支持离线使用、无需GPU,数据不外泄。命令行+API调用,轻松构建私有AI应用!

想在自己的电脑上免费运行 Llama 3、Mistral、Gemma、Qwen 等开源大模型?
不想依赖 API、不担心隐私泄露、还能离线使用?
Ollama 就是你的最佳选择!
Ollama 是一个专为本地运行大语言模型(LLM)设计的开源工具,支持 macOS、Linux 和 Windows(WSL),一键拉取、一键运行,极大简化了本地部署流程。
今天,我们就从零开始,手把手教你用 Ollama 在本地部署并调用大模型!

一、什么是 Ollama?

✅ 开源免费,本地运行,数据不出内网;
✅ 支持主流开源模型:Llama 3、Mistral、Phi-3、Gemma、Qwen、Yi 等;
✅ 自动管理模型下载、量化、推理;
✅ 提供命令行交互 + REST API + Web UI(通过第三方);
✅ 支持 CPU 推理(无需 GPU,但有 GPU 会更快)。

二、安装 Ollama

Linux

curl -fsSL https://ollama.com/install.sh | sh

macOS(推荐 M1/M2/M3 芯片)

brew install ollama

三、运行第一个模型:Llama 3

Ollama 内置模型库,只需一条命令即可下载并运行!

ollama run llama3

首次运行会自动下载 Llama 3 8B(约 4.7GB,量化版),下载完成后进入交互模式:

>>> 你好!
你好!有什么我可以帮你的吗?
>>> 用 Python 写一个快速排序
...

✅ 支持中文、代码生成、逻辑推理等任务!

四、常用命令速查

命令 说明
ollama run 运行指定模型(如 llama3, mistral, qwen:7b)
ollama list 查看已下载的模型
ollama pull 手动下载模型(不立即运行)
ollama rm 删除模型
ollama ps 看正在运行的模型进程

五、通过 API 调用模型(供程序集成)

Ollama 启动后会自动开启 本地 REST API(默认 http://localhost:11434)。
示例:用 Python 调用 Llama 3

import requests

response = requests.post(
    'http://localhost:11434/api/generate',
    json={
   
        "model": "llama3",
        "prompt": "用一句话解释量子计算",
        "stream": False
    }
)

print(response.json()['response'])

输出:

量子计算利用量子比特的叠加和纠缠特性,实现远超经典计算机的并行计算能力。
API 说明
端点:POST /api/generate
参数:
model: 模型名称
prompt: 输入提示
stream: 是否流式输出(False 返回完整结果)
返回:JSON 格式,response 字段为模型输出

结语

Ollama 让大模型本地化变得前所未有的简单。无论你是开发者、研究员,还是 AI 爱好者,都可以在自己的电脑上:

  • 私有化部署大模型;
  • 构建本地 AI 应用;
  • 学习 LLM 原理;
  • 保护数据隐私。
目录
相关文章
|
17天前
|
存储 弹性计算 人工智能
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
2025年9月24日,阿里云弹性计算团队多位产品、技术专家及服务器团队技术专家共同在【2025云栖大会】现场带来了《通用计算产品发布与行业实践》的专场论坛,本论坛聚焦弹性计算多款通用算力产品发布。同时,ECS云服务器安全能力、资源售卖模式、计算AI助手等用户体验关键环节也宣布升级,让用云更简单、更智能。海尔三翼鸟云服务负责人刘建锋先生作为特邀嘉宾,莅临现场分享了关于阿里云ECS g9i推动AIoT平台的场景落地实践。
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
|
9天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
12天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
1044 33
|
11天前
|
机器学习/深度学习 人工智能 搜索推荐
万字长文深度解析最新Deep Research技术:前沿架构、核心技术与未来展望
近期发生了什么自 2025 年 2 月 OpenAI 正式发布Deep Research以来,深度研究/深度搜索(Deep Research / Deep Search)正在成为信息检索与知识工作的全新范式:系统以多步推理驱动大规模联网检索、跨源证据。
806 55
|
9天前
|
文字识别 测试技术 开发者
Qwen3-VL新成员 2B、32B来啦!更适合开发者体质
Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!
697 11
下一篇
开通oss服务