文档备案控制台

开发者社区云原生文章正文

初始ollama

2025-08-16 258

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Ollama 按需加载模型，不持续运行，闲置时自动卸载，节省内存。模型响应请求时驻留内存，保留时间由 OLLAMA_KEEP_ALIVE 控制。类似 Docker 部署方式，但无单模型启停命令，默认时间内自动停止。可间接通过停止服务或配置多端口实现管理。

Ollama 模型运行机制

按需加载：Ollama 不会持续运行所有已下载的模型，而是按需加载
自动卸载：当模型闲置一段时间（默认 5 分钟）后，Ollama 会自动从内存中卸载
内存管理：模型仅在响应请求时驻留内存，请求结束后保留在内存中的时间由 OLLAMA_KEEP_ALIVE 控制

ollama与docker类似之处，都相当于在上面进行部署

比如docker 可以进行images部署运行，启停等等操作

ollama可以进行大模型部署（按需），没有提供单个大模型的启停命令

但是会在默认的限制时间内，自动停止运行（自动卸载）（最优解）

间接解决方案：

1.直接停止ollama服务，再重新开启需要运行的大模型（最有效）

2.创建多个ollama（端口不同），一个大模型一个ollama即可（繁琐）

3.直接rm操作（但是这是删除操作，本质上还在运行，并且停止后，如果要再运行需重新下载）（无法实现，常犯问题）

文章标签：

容器

Docker

游客ei4oozwd2l7wm

目录

相关文章

小鲸云

|

4天前

|

人工智能自然语言处理应用服务中间件

阿里云一键部署Clawdbot (Moltbot)详细教程，轻松打造个人AI助手

近期，GitHub上的开源项目Moltbot（原Clawdbot）迅速走红，上线后很快收获7.6万+Star，不少海外开发者甚至专门抢购Mac mini用于本地部署。这款AI智能体之所以备受关注，是因为它不只是简单的聊天工具，而是真正能“干活”的助手——可以像与同事沟通一样下达自然语言指令，比如“整理上周会议纪要”“查询用户反馈”“编写Python脚本”等，不仅能理解上下文、记住历史交互，还能调用工具自动执行任务。

小鲸云

585 4 4

霍格沃兹测试开发

|

7月前

|

人工智能缓存数据可视化

手把手玩转本地大模型：Ollama+DeepSeek+Dify 零门槛全流程指南

本文提供从零搭建本地AI工作站的完整指南，详解本地化部署大模型的核心优势（数据隐私/离线可用/成本可控），涵盖Ollama安装、DeepSeek-Coder模型部署、Dify可视化操作及API调用实战，助你打造安全高效的私有AI开发环境。

霍格沃兹测试开发

2664 0 0

知与谁同

|

算法数据可视化大数据

用Python玩玩OSMnx包获取道路数据并可视化分析

知与谁同

7792 0 1

啦啦啦191

|

6月前

|

前端开发 Java API

2025 年 Java 全栈从环境搭建到项目上线实操全流程指南：Java 全栈最新实操指南（2025 版）

本指南涵盖2025年Java全栈开发核心技术，从JDK 21环境搭建、Spring Boot 3.3实战、React前端集成到Docker容器化部署，结合最新特性与实操流程，助力构建高效企业级应用。

啦啦啦191

1870 1 2

探索云世界

|

6月前

|

云安全人工智能安全

Ollama漏洞引发的“血案”—自建LLM的安全思考

「云安全技术观察」聚焦云计算时代安全技术前沿与实践，涵盖AI大模型风险、云原生安全体系建设及攻防对抗等内容，提供落地技术参考与前瞻性洞察。

探索云世界

716 0 0

Echo_Wish

|

6月前

|

机器学习/深度学习人工智能搜索推荐

AI+基因数据：健康诊断的“未来体检报告”来了

AI+基因数据：健康诊断的“未来体检报告”来了

Echo_Wish

210 6 6

不起名字可以不

|

7月前

|

数据采集数据可视化 JavaScript

用通义灵码和 PyQt5 爬虫智能体轻松爬取掘金，自动化采集技术文章和数据

本文介绍了如何利用智能开发工具通义灵码和Python的PyQt5框架，构建一个自动化爬取掘金网站技术文章和数据的智能爬虫系统。通过通义灵码提高代码编写效率，使用PyQt5创建可视化界面，实现对爬虫任务的动态控制与管理。同时，还讲解了应对反爬机制、动态内容加载及数据清洗等关键技术点，帮助开发者高效获取并处理网络信息。

不起名字可以不

633 4 4

小华同学ai

|

7月前

|

人工智能自然语言处理监控

【惊喜】25.5k star 被公认为最省时的后台模板：ngx‑admin 深度解析！

小华同学专注分享高效工作与前沿AI工具，每日精选开源技术与实战技巧，助你节省50%时间，快速提升效率。订阅用户已超10万+，覆盖多种技术领域，免费获取升级秘籍！

小华同学ai

182 0 0

霍格沃兹测试开发学社

|

4月前

|

数据采集人工智能自然语言处理

Playwright MCP 浏览器自动化框架全面解析

Playwright MCP是微软推出的开源项目，结合Playwright与MCP协议，让AI通过结构化数据直接操作浏览器。告别传统视觉识别，实现高效、精准的网页自动化，广泛应用于测试、爬虫、办公自动化等场景，大幅提升效率与可靠性。

霍格沃兹测试开发学社

903 4 5

hanans426

|

监控数据可视化关系型数据库

Dify: 一款宝藏大模型开发平台: 部署及基础使用

Dify 是一款开源的大语言模型（LLM）应用开发平台，融合了后端即服务（Backend as Service）和 LLMOps 的理念，使开发者可以快速搭建生产级的生成式 AI 应用。即使非技术人员也能参与 AI 应用的定义和数据运营。计算巢提供了 Dify 的快速部署解决方案，包括单机版和高可用版，支持通过 Docker Compose 和阿里云 ACK 部署，适用于开发测试和生产环境。用户可以通过配置 API、WebApp 脚手架等轻松集成 Dify 到业务中，极大简化了大语言模型应用的开发流程。

hanans426

6691 22 24

Dify: 一款宝藏大模型开发平台: 部署及基础使用

热门文章

最新文章

CentOS yum源设置为国内aliyun yum源

Rust 笔记：Rust 语言中使用 vector（向量）

PS内容识别填充让图片闹鬼？新升级消灭乱涂乱画，让你刮目相看

Swagger接口文档 —— 手把手教学，全方位超详细小白能看懂，百分百能用Java版

thymeleaf实现ajax请求的两种方式

史上首次现场直播下线物理机，三维家全面上云

A.3-C# 面向对象编程

ASP.NET常被忽视的一些细节

如何从微信公众平台上下载关注用户(备份微信关注用户)

加入收藏兼容ie和火狐

DiTASK：用“橡皮泥手术”改造ViT，一次搞定多个视觉任务

Vue3项目JSON格式化工具技术实现详解

PPO算法深度解析：为什么它如此强大又如此“挑食”？

JSON格式化与压缩在线工具分享

为什么GEO优化是新的内容战略核心？尹邦奇三层结构模型深度解读

记一次静态博客前端问题的优化：针对FOUC问题的解决方案

《羁绊型反派塑造：情感闭环与角色立体度打造指南》

《动态捕食猎物关系手册：生态可信性构建与玩家长期行为响应策略》

3分钟让Chrome变聪明！Google AI保姆级激活教程！

【SSVEP】基于SSVEP检测频率导向脑活动的VR实验附Matlab代码

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

第五届伏魔挑战赛如约来袭，诚邀各路高手来战！