在 OpenCode 中接入本地模型:Ollama 部署与配置完全指南

简介: OpenCode火爆GitHub(17万星),但配置模型常卡壳。本文直击痛点,手把手教你15分钟用Ollama本地部署Qwen/Llama/CodeLlama等开源模型,并完成OpenCode对接——零API密钥、全离线运行,安全高效适配敏感开发场景。

OpenCode 这玩意儿最近挺火。GitHub 上 17 万星,月活 750 万,支持 75 种以上模型提供商。但很多人装完之后卡在第一步:模型怎么配?API Key 往哪放?

这篇文章不扯概念,只说步骤。目标是让你在 15 分钟内,用 Ollama 跑起本地模型,让 OpenCode 真正干活。

一、Ollama:先把本地模型跑起来
Ollama 是目前最流行的本地大模型部署工具,能把模型打包成标准的 OpenAI 兼容接口。说白了就是让你在本地跑 Llama、Qwen、DeepSeek 这些开源模型,不用掏钱买 API。

1.1 安装 Ollama
各系统命令不一样:

macOS

brew install ollama
Linux

curl -fsSL https://ollama.com/install.sh | sh
Windows:去官网下载安装包,或者用 WSL2 跑 Linux 那套。

装完之后验证一下:

ollama --version
1.2 拉取模型
Ollama 的模型仓库里东西不少。挑一个适合你硬件的:

7B 参数级别,8GB 显存差不多够用

ollama pull qwen3.5

或者 Llama 系列

ollama pull llama3.2

代码专用

ollama pull codellama:7b
OpenCode 对上下文长度有硬性要求——至少 64k。拉模型的时候留意一下这个参数,太小的话 OpenCode 用不了。

下载完成后确认一下:

ollama list
1.3 启动服务
Ollama 安装后会默认在后台跑着,监听 http://localhost:11434。不放心的话手动启一下:

ollama serve
默认端口是 11434,后面配置 OpenCode 的时候要用到。

二、OpenCode:安装与配置
2.1 安装 OpenCode
前提:Node.js 18 及以上。

三种装法,挑一个:

npm 全局安装(推荐)

npm install -g opencode-ai
一键脚本

curl -fsSL https://opencode.ai/install | bash
Homebrew(macOS/Linux)

brew install sst/tap/opencode
验证:

opencode --version
2.2 配置 Ollama 作为模型提供方
OpenCode 的配置文件有两个位置:

项目级:项目根目录下的 opencode.json
全局级:~/.config/opencode/opencode.json
推荐用全局配置,省得每个项目都配一遍。

方式一:手动配置(推荐,更可控)
编辑 ~/.config/opencode/opencode.json:

{
"$schema": "https://opencode.ai/config.json",
"provider": {
"ollama": {
"npm": "@ai-sdk/openai-compatible",
"name": "Ollama",
"options": {
"baseURL": "http://localhost:11434/v1"
},
"models": {
"qwen3.5": {
"name": "qwen3.5"
},
"llama3.2": {
"name": "llama3.2"
},
"codellama": {
"name": "codellama:7b"
}
}
}
}
}
baseURL 指向 Ollama 的 OpenAI 兼容端点。models 下面列出你想用的模型,名字要和 ollama list 里看到的一致。

方式二:用官方插件(自动发现模型)
不想手写模型列表?装个插件自动发现:

npm install -g opencode-local-ollama
然后在配置文件里加上:

{
"plugin": ["opencode-local-ollama"]
}
重启 OpenCode,敲 /models 就能看到所有 Ollama 里已下载的模型,自动注册为 ollama/<模型名>。

插件默认连接 http://localhost:11434,也可以通过环境变量 OLLAMA_HOST 或插件选项修改。

方式三:ollama launch 一键启动(最省事)
Ollama 0.15 以上版本支持一条命令搞定:

ollama launch opencode
会交互式地让你选模型,然后自动拉起 OpenCode。不需要手动配配置文件。

2.3 验证配置
启动 OpenCode:

opencode
进去之后输入 /models,应该能看到你配置的模型出现在列表里。选中一个,就可以开始用了。

如果看不到模型,检查几件事:

Ollama 服务是否在跑:curl http://localhost:11434/api/tags
配置文件路径对不对
baseURL 是不是 http://localhost:11434/v1(注意末尾的 /v1)

三、进阶配置
3.1 远程 Ollama 服务器
如果模型跑在另一台机器上(比如一台带 GPU 的服务器),改一下 baseURL 就行:

"options": {
"baseURL": "http://192.168.1.100:11434/v1"
}
或者用环境变量:

export OLLAMA_HOST=http://192.168.1.100:11434
安全提醒:别把 Ollama 服务直接暴露到公网。用 SSH 隧道或者内网隔离。

3.2 上下文长度调优
OpenCode 要求 64k 以上的上下文。Ollama 的模型元数据里标的上下文窗口可能很大(比如 131072),但实际运行时 num_ctx 可能小得多。

如果用的是 opencode-local-ollama 插件,可以显式指定上下文长度:

{
"plugin": [
[
"opencode-local-ollama",
{
"context": 65536,
"output": 4096
}
]
]
}
3.3 权限控制
本地模型跑起来之后有个坑要注意:OpenCode 的工具能读文件、写文件、执行 Shell 命令。本地模型响应快,你可能迭代着迭代着就忘了自己给过什么权限。

建议在配置里把高风险操作设成需要人工确认,别图省事全自动。

四、常见问题
Q:OpenCode 启动后看不到 Ollama 模型

A:先确认 Ollama 在跑:curl http://localhost:11434/api/tags。能返回模型列表就说明服务正常。然后检查 baseURL 是否包含 /v1。

Q:模型跑起来很慢

A:本地模型吃硬件。7B 模型至少需要 8GB 显存,量化版本(如 Q4)可以降低门槛。另外检查一下上下文长度是不是设得太大了。

Q:Windows 上各种报错

A:官方推荐用 WSL2。Windows 原生终端对路径和权限的处理有些兼容性问题,WSL 里跑省心很多。

Q:ollama launch opencode 和手动配置有什么区别

A:ollama launch 是 Ollama 提供的快捷方式,用内联配置启动 OpenCode,不会覆盖你已有的 opencode.json。适合快速试玩,长期用还是建议手动配。

五、总结
整个流程捋下来就是三步:

装 Ollama,拉模型,确保服务在 11434 端口跑着
装 OpenCode,配 opencode.json,指向 Ollama 的 /v1 端点
启动 OpenCode,/models 选模型,开干
本地模型跑起来之后,OpenCode 就是一个完全离线的 AI 编码 Agent。代码、对话记录全在本地,不上传任何东西到云端。对于处理敏感代码或者网络受限的场景,这套组合拳比用云 API 踏实得多。

相关文章
|
5天前
|
人工智能 JSON 自然语言处理
让教学更智慧:用阿里云百炼工作流,自动生成中小学教材内容#小有可为#有温度的AI
通过可视化工作流编排,将大模型推理能力转化为标准化的教学内容生成引擎。教师只需输入教材标题和适用学段,即可自动获得结构完整、符合课程标准的章节内容,大幅降低备课门槛,助力教育资源均衡化。
462 123
|
7天前
|
人工智能 定位技术 SEO
我学 GEO 第 15 天:终于知道AI GEO该如何做?
我是暴走的莉莉酱,边旅行边研究AI GEO的数字游民。专注普通人如何提升“AI可见度”——让AI在回答用户问题时准确识别、理解并推荐你。不讲玄学,只做可测、可调、可持续的GEO实践。
443 127
|
10天前
|
机器学习/深度学习 人工智能 调度
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
HappyHorse 1.1 是新一代视频生成大模型,全面升级动态表现力、角色一致性、指令遵循、视觉质感与音画协同能力。支持I2V/T2V/R2V三类生成,适配短剧、电商广告、品牌营销等场景,提供高质、流畅、可控的AI视频生产力。
750 5
🐴 HappyHorse 1.1 现已上线阿里云百炼!快来查收模型使用指南,现在调用享 6 折~
|
1天前
|
消息中间件 存储 Kafka
Kafka 原生消息入湖能力上线!一键打通实时流与数据湖
阿里云消息队列 Kafka 版正式上线原生消息入湖能力。
213 121
|
1天前
|
人工智能 安全 Cloud Native
Higress 新发布:AI Gateway 能力增强,Gateway API 及其推理扩展持续打磨
增强 AI 网关能力,持续打磨 Gateway API 及其推理扩展。
247 122
|
7天前
|
缓存 人工智能 运维
阿里云618百炼大模型Qwen3.7-Max功能、免费试用、订阅计费、配置接入详解
Qwen3.7-MAX是阿里云百炼平台推出的通义千问3.7系列旗舰大语言模型,专为智能体时代复杂任务打造,依托阿里云全域算力与自研技术,在逻辑推理、长文本处理、代码工程、长周期自主执行等领域达到行业顶尖水平。2026年618期间,该模型推出多重免费试用权益、按量计费5折、订阅套餐优惠等专属福利,覆盖个人开发者、团队与企业全场景需求,以下从核心功能、免费试用、订阅计费、配置接入四方面展开详细解析。
445 123
|
5天前
|
人工智能 自然语言处理 API
阿里云Token Plan团队版解析:功能、三档套餐与省钱订阅指南
阿里云百炼平台推出的Token Plan团队版,是面向企业与团队的AI大模型订阅服务,以Credits为统一计量单位,整合文本与图像生成模型,提供团队管理、数据安全、多工具兼容等核心能力,解决团队零散订阅AI服务的管理混乱、成本失控、数据安全等痛点。本文将从核心定位、套餐详情、计费规则、团队管理、工具兼容、便宜订阅技巧等方面,全面解析Token Plan团队版,帮助企业与团队高效、低成本地使用AI服务。
327 108
|
15天前
|
Linux 程序员 数据格式
【2026最新】Notepad++下载、安装和使用一篇搞定(附中文版安装包)
Notepad++ 是一款免费开源、轻量高效的 Windows 文本编辑器,支持 C/Python/HTML 等 80+ 语言语法高亮、代码折叠、正则替换、编码转换及插件扩展,专为程序员与文本处理用户打造,完美替代系统记事本。(239字)