一、Ollama 是什么
ollama 是一个在本地电脑/服务器上运行大语言模型的工具。你可以把它理解成「自己机器上的模型运行时」,在本机加载推理,通过命令行或 HTTP API 对话,请求和数据默认不出你的电脑。
日常用法很简单。装好 Ollama 后,终端里 ollama pull、ollama run 即可交互;程序侧通过 HTTP API 对话(默认 127.0.0.1:11434,接口细节见 部署实战 · Ollama API)。
它适合这几类部署:
●开发机 / 工作站 — 有 NVIDIA 显卡,本地试 prompt、接 RAG 原型。
●公司 GPU 服务器 — 团队共用一台推理机,模型和日志留在内网。
●边缘或工控旁路设备 — 算力有限,跑 7B、8B 小模型做专用任务。
和直接调 OpenAI、Anthropic 等云 API 比,Ollama 的核心优势:模型文件和推理过程在你掌控的硬件上,不依赖公网 SaaS,适合对数据出境、调用零成本、离线可用性有要求。
二、为啥要把 Ollama 暴露出去
出于成本/安全考虑,越来越多企业及团队把 Ollama 部署在内网机房或私有云里,Ollama 装完就能跑,curl localhost:11434 就能对话,数据不出内网,成本也可控。
但模型服务跑起来之后,访问往往还停在本机或内网可用。当同事在家或出差想调 /v1/chat/completions;或手机 Demo 要连回公司 GPU;外面的 RAG 服务要把检索结果发给内网 Ollama——这些请求默认到不了内网那台机器。
常规做法不外乎下面几种:
●VPN 拨回内网 — 能用,但每个调用方都要装客户端,临时联调很麻烦,设备投入和运维成本也不低。
●路由器端口映射 — 把 11434 直接扔到公网,HTTPS 没有,谁拿到地址谁都能调,模型和数据风险都很大。
●云 API 中转 — 绕一圈公有云,本地部署的意义被削弱,云带宽成本也高。
那有没有一种既安全又简单的方法,把本地 Ollama 映射到公网?
ZeroNews内网穿透能较好解决 Ollama 公网安全访问的问题:IP 白名单、Basic 认证、地区访问控制等多种策略可保障 API 访问安全;Client 出站连接,适应无公网 IP 的机房环境。
四、Ollama 安全访问流量路径
调用方(同事 PC / 外部 App / 另一个服务)
│ HTTPS
▼
ZeroNews 边缘网关(TLS、访问策略)
│ HTTPS
▼
前置访问策略(IP 白名单、Basic 认证、路由白名单/地区访问控制)
│ 加密隧道
▼
ZeroNews Client(与 Ollama 同机或同网段)
│ http://127.0.0.1:11434
▼
Ollama(仅本机监听,不改为 0.0.0.0)

安全原则:
1.Ollama 不直接对公网开放,保持 127.0.0.1:11434。
2.只映射 API 端口,只映射 Ollama 的服务端口 11434, 其他端口一律关闭。
3.只开放 API 指定路由,只开放 API 指定路由路径,如 /v1/chat/completions,不用暴露的路由路径一律不开放。
4.在 ZeroNews 层做访问控制,弥补 Ollama 无原生 API Key 的缺口。
五、常见使用场景
同事联调 RAG。 检索服务在 A 机器,Ollama 在 B 机器(GPU)。B 上映射 API,A 通过 HTTPS 调 B 的 /v1/chat/completions,不用拉 VPN,联调地址固定好分享即可。
外网 Demo 给客户看。 本地部署的行业模型给客户演示,临时开 HTTPS 域名,Demo 结束关隧道;比把整个办公网 VPN 给客户账号安全得多。
多办公点共用一台 GPU 服务器。 公司只有一台 4090 机器,上海、北京同事都要调 API。ZeroNews 提供统一 HTTPS 入口 + IP 白名单,Ollama 仍在机房内网。
自动化脚本远程推理。 CI 或定时任务通过公网域名调用内网 Ollama 做批量摘要——建议固定域名 + 严格 IP 限制,并评估 GPU 队列,避免和人工争资源。
七、怎么安全地使用 ZeroNews
ZeroNews 简单几步就把 Ollama 接到公网不难,针对不同的应用场景,ZeroNews 可以提供差异化的安全使用需求
多场景、多映射:别一条隧道包打天下
将 Ollama 映射多条隧道,提供多个域名都能访问到 Ollama,做差异化访问需求,不建议共用一个万能域名 + 零限制的映射。

对外正式提供服务 — 绑定企业自有域名,对外口径统一,跟企业品牌一致,这条隧道长期使用。
临时联调、内部测试 — 用 ZeroNews 平台分配的临时子域即可。联调范围小、生命周期短,Demo 或 sprint 结束直接在控制台删隧道,域名随之失效,不会跟正式环境抢入口,也方便日后回收,不留长期暴露面。
不同用途分开建映射 — 员工外勤一条、合作伙伴一条、对外开放 API 一条,哪怕都指向同一台 127.0.0.1:11434,在 ZeroNews 上也是独立的隧道。好处是权限策略可以按域名隔离,某条出问题也只关那一条,不用动全局。
给企业员工:认人不认共用一个密码
员工在家、出差要调内网 Ollama,适合单独一条内部员工映射。

Basic 认证,一人一账号。 在隧道上启用 Basic Auth,给每位需要外网访问的员工分配独立账号口令,不要全公司共用一个 admin:123456。谁在用、什么时候在用,至少能对应到个人;人员离职时在控制台改密或删账号,不必全员换 VPN。
地区访问控制。 若员工主要在国内办公,可开启地区访问控制,只允许中国大陆(或你指定的省/区域)来源访问,异常海外 IP 直接拦在网关外,降低撞库和扫描风险,也减少「账号泄露后被海外滥用」的可能。
给外协 / 合作伙伴:先认 IP,再认路径
外协厂、集成商、短期合作方没有你们 VPN,也不该进整网。单独为合作方建一条映射,策略宜先卡来源,再卡路径
IP 访问黑白名单。 让对方提供固定出口 IP(或少量 IP 段),写入白名单;只有这些来源能打到该域名。若发现滥用,可先拉黑单个 IP 而不关正式员工隧道。黑名单可挡已知恶意扫描源。
路由白名单,最小暴露面。 Ollama 默认暴露整站 API 时,对外协若只需委外相关或指定推理接口,在 ZeroNews 配置路由白名单,只允许如 /v1/chat/completions 等必要路径,其余路由一律 404 或拒绝。路由再收窄一层,外协看不到不该看的管理类接口。
对外提供 API 接口:路由白名单是底线
若 Ollama(或前面挂的 API 网关)作为对外公开的 LLM API 给第三方系统调用,这是暴露面最大的一类,建议单独域名 + 最严策略
严格路由白名单。 只放行业务真正用到的路径,例如 /v1/chat/completions、/v1/embeddings;明确不暴露 /api/tags(拉模型列表)、/api/pull 等与对外服务无关的管理/运维类路由。ZeroNews 在边缘按路径过滤,即使 Ollama 本机开着更多接口,公网也打不进去。
六、ZeroNews 的价值
把 Ollama 暴露到公网,不只是有个地址能访问——还要安全、稳、好维护。ZeroNews 在 Ollama 这类本地 LLM 场景里,价值主要体现在下面几方面。
按需映射,暴露面最小化。 ZeroNews 只需要映射 Ollama 的API 端口,同时提供 HTTPS、IP 白名单、Basic 认证、地区访问控制等的安全能力最大化的保障 ollama 的访问安全。
稳定、快速访问 ZeroNews 采用优质的 BGP 大带宽线路,前置负载均衡实现多网关负载与容灾,实时检测内网Ollama API 可用性。
AI 加持。 ZeroNews 提供 https://zeronews-local-api-ci-case-study.md 和 https://zeronews-agent-skills-guide.md :脚本里动态建隧道、Cursor / Claude Code 里一句话完成 Client 配置和端口映射。Ollama 联调、临时 Demo、自动化流水线开入口,都可以和 AI 工具链接在一起,不用每次登录控制台点鼠标。
自有域名,维持企业形象。 证书自动申请与支持绑定企业自有域名,HTTPS续期。给同事、客户或合作方的是 https://llm-api.yourcompany.com 统一访问,而不是临时随机子域,品牌和合规口径也更好统一。
零运维、部署简单。 ZeroNews 不依赖企业具备公网 IP,运行软件客户端简单几步即可完成Ollama 公网访问,无侵入现有网络的部署模式,没有复杂 NAT 配置及硬件投入,访问端也无需安装任何客户端,没有任何运维成本,任何人都可以手上配置。
八、小结
Ollama 和本地 LLM 的优势是数据可控、成本透明,但 API 默认只服务本机。把 11434 裸映射公网既不安全也不符合常见合规直觉。
更稳妥的路径是:Ollama 守在本机,ZeroNews 映射 HTTPS,控制台叠加 IP 白名单与 Basic 认证,调用方走标准 OpenAI 兼容接口。 网络可达交给 ZeroNews,模型权限和业务审计仍握在你自己手里。