备案控制台

开发者社区人工智能文章正文

Ollama部署本地模型

2024-07-29 466

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Ollama 是一个用于本地部署大型语言模型的平台。首先关闭 ollama 服务，在环境变量中设置 `OLLAMA_MODELS` 为目标模型路径，`OLLAMA_ORIGINS` 为 `"*"`，重启服务和 VSCode。启动服务 `ollama serve`，运行 `ollama run codegeex4`。配置插件接口地址为 `http://localhost:11434/v1/chat/completions`，并在模型名称处填入 `codegeex4` 启用高级模式。可能需优化下载速度并解决其他问题。

Ollama使用
什么是Ollama
下载
配置模型下载地址
首先，把启动着的ollama关闭，然后在用户环境变量中点击新建环境变量

OLLAMA_MODELS的值为你希望模型所在的地址。

OLLAMA_ORIGINS = "*"

设置后需要重启ollama服务和vscode

启动ollama服务ollama serve

再打开一个新的终端，在终端输入ollama run codegeex4

在本地模式中配置接口地址

在插件的配置页配置模型地址http://localhost:11434/v1/chat/completions

打开模型高级模式，在模型名称栏中填写：codegeex4

提高ollama下载模型速度
可能存在的问题

Reference
‍‍‬‍⁠‬‬⁠‬⁠‬‌‌‬‍‬‍‌‬⁠‍‍‌‬‍CodeGeeX 本地模式使用指南 - 飞书云文档 (feishu.cn)

THUDM/GLM-4: GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型 (github.com)

glm4 (ollama.com)

常见问题解答 - Ollama中文网

CodeGeeX4/README_zh.md at main · THUDM/CodeGeeX4 (github.com)

codegeex4 (ollama.com)

CodeGeeX4/guides/Local_mode_guideline_zh.md at main · THUDM/CodeGeeX4 (github.com)

Ollama教程——入门：开启本地大型语言模型开发之旅_ollama中文说明书-CSDN博客

文章标签：

自然语言处理

Haluki

目录

相关文章

baker_zhuang

|

3月前

|

人工智能并行计算搜索推荐

ollama本地部署llama3（window系统）

这篇文章详细介绍了如何在Windows系统上本地部署Ollama框架来运行Llama 3大模型，并提供了具体的安装步骤和注意事项，以便实现离线使用高级AI模型进行对话。

baker_zhuang

416 0 0

ollama本地部署llama3（window系统）

CrissChan

|

2月前

|

Linux iOS开发异构计算

Ollama完成本地模型的运行

# Ollama完成本地模型的运行

CrissChan

381 5 5

Ollama完成本地模型的运行

叫做饺子

|

14天前

|

自然语言处理并行计算 API

Qwen模型应用：微调与部署实践

Qwen模型应用：微调与部署实践

叫做饺子

264 0 0

路人与大师

|

2月前

|

人工智能并行计算监控

深入剖析 Qwen2.5 - 32B 模型在 VLLM 上的单机三卡部署与运行

本文深入探讨了Qwen2.5 - 32B模型在VLLM框架上的部署过程，从模型下载、启动命令、资源占用分析到GPU资源分配及CUDA图应用，详述了大模型运行的挑战与优化策略，强调了硬件资源规划与技术调优的重要性。

路人与大师

746 2 2

阿里云计算巢-巴梨

|

2月前

|

存储安全 API

使用Ollama和Open WebUI管理本地开源大模型

Open WebUI 是一个功能丰富且用户友好的自托管 Web 用户界面（WebUI），它被设计用于与大型语言模型（LLMs）进行交互，特别是那些由 Ollama 或与 OpenAI API 兼容的服务所支持的模型。Open WebUI 提供了完全离线运行的能力，这意味着用户可以在没有互联网连接的情况下与模型进行对话，这对于数据隐私和安全敏感的应用场景尤为重要。

阿里云计算巢-巴梨

384 0 1

AIweker

|

3月前

|

Linux Shell API

ollama 大模型部署工具 | AIGC

Ollama是一个集成了多种大型语言模型的工具，它支持模型的部署、运行以及API的整合和调用。Ollama为不同操作系统的用户提供了便捷的安装方式，并具备丰富的命令行界面（CLI）和API接口，使得用户可以轻松地管理和运行大型模型。【10月更文挑战第1天】

AIweker

326 0 0

六月的雨在钉钉

|

5月前

|

人工智能异构计算

基于PAI-EAS一键部署ChatGLM及LangChain应用

【8月更文挑战第7天】基于PAI-EAS一键部署ChatGLM及LangChain应用

六月的雨在钉钉

94 2 2

mingupup

|

5月前

|

API C#

SemanticKernel/C#：使用Ollama中的对话模型与嵌入模型用于本地离线场景

SemanticKernel/C#：使用Ollama中的对话模型与嵌入模型用于本地离线场景

mingupup

115 0 0

周周的奇妙编程

|

8月前

|

机器人 Linux API

基于Ollama+AnythingLLM轻松打造本地大模型知识库

Ollama是开源工具，简化了在本地运行大型语言模型（ile优化模型运行，支持GPU使用和热加载。它轻量、易用，可在Mac和Linux上通过Docker快速部署。AnythingLLM是Mintplex Labs的文档聊天机器人，支持多用户、多种文档格式，提供对话和查询模式，内置向量数据库，可高效管理大模型和文档。它也是开源的，能与Ollama结合使用，提供安全、低成本的LLM体验。这两款工具旨在促进本地高效利用和管理LLMs。

周周的奇妙编程

148518 32 54

flydean程序那些事

|

6月前

|

人工智能 Linux Windows

MoneyPrinterPlus全面支持本地Ollama大模型

现在,MoneyPrinterPlus除了支持大模型厂商的服务之外，还可以接入本地的Ollama大模型了。

flydean程序那些事

103 0 0

热门文章

最新文章

ToC和ToB有啥区别

多中心容灾实践：如何实现真正的异地多活？

时间序列预测：CNN+LSTM+Attention模型实战

DSP_代码笔记（基于TMS320X281x）

Confluence 6 那些文件需要备份

区块链技术将占据全球金融系统核心地位

一个有味道的函数

ceph启动脚本

[CLR via C#]7. 常量和字段

PsycoLLM：开源的中文心理大模型，免费 AI 心理医生，支持心理健康评估与多轮对话

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

Gemini Coder：基于 Google Gemini API 的开源 Web 应用生成工具，支持实时编辑和预览

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

MiniPerplx：基于 Grok 2.0 的开源 AI 搜索引擎，支持网页、学术、视频搜索

CreatiLayout：复旦与字节联合推出布局到图像生成技术，支持高质量图像生成与布局优化

Cosmos：英伟达生成式世界基础模型平台，加速自动驾驶与机器人开发

AIOpsLab：云服务自动化运维 AI，微软开源云服务 AI 框架，覆盖整个生命周期

《docker基础篇：4.Docker镜像》包括是什么、分层的镜像、UnionFS（联合文件系统）、docker镜像的加载原理、为什么docker镜像要采用这种分层结构呢、docker镜像commit

《鸿蒙安全沙箱机制——人工智能应用的安全护盾》

相关课程

更多

云原生AI套件：一键训练大模型及部署GPU共享推理服务

基于ASK轻松部署企业级Stable Diffusion

相关电子书

更多

PAI-Megatron-Patch：灵骏集群训练 LLMs

低代码开发师（初级）实战教程

阿里巴巴DevOps 最佳实践手册

相关实验场景

更多

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

【文生图】一键部署Stable Diffusion基于函数计算

在云上部署ChatGLM2-6B大模型（GPU版）

【玩转ComfyUI】基于函数计算一键部署AI生图平台 ComfyUI

【自由换模型】基于函数计算一键部署 Stable Diffusion

使用PAI-快速开始，低代码实现大语言模型微调和部署

下一篇

DataWorks智能交互式数据开发与分析之旅