察元AI还超级智能体 桌面单机版的核心隐私承诺:所有数据落在用户目录,不出域。这一篇讲实现。
承诺的具体含义。
具体一:对话历史在本地。所有 LLM 对话在 CHAYUAN_ROOT/data 的 SQLite 文件。不上传任何云。
具体二:知识库在本地。doc:* 文档库的 chunk 跟向量在 CHAYUAN_ROOT/vectors。不上传。
具体三:上传的原文件在本地。CHAYUAN_ROOT/uploads。不上传。
具体四:模型钥匙在本地。CHAYUAN_ROOT/credentials 加密存。不上传。
具体五:诊断日志在本地。CHAYUAN_ROOT/logs。不上传。
例外。LLM 调用本身。如果用户用云端模型(OpenAI、文心等),prompt(含 chunk 内容)发到厂商云。这部分不可避免。如果用户在意,用本地推理(Ollama)即可完全闭环。
工程实现。
实现一:sidecar 默认绑 127.0.0.1。外部网络访问不到。
实现二:禁用任何 默认 telemetry。chayuan-desktop 不发使用统计、不发 crash report 到云端(除非用户主动开 Langfuse 接入)。
实现三:模型钥匙加密。Stronghold + ChaCha20。
实现四:Tauri 配置 capability 限制。前端能调的 native API 严格白名单。
CLAUDE.md 里的红线。
红线一:不在查询阶段允许前端覆盖 embedding 模型。
红线二:vector / source 结果不能展示成 可下载文档附件 误导用户。
红线三:未验证就提交或推送代码。
红线四:没有权限校验就访问 KB / source。
红线五:在路由文件里继续堆大段业务 dispatch。
这些规则保护数据完整性和合规性。
跟厂商云模型的关系。chayuan-desktop 不替用户选 云端 vs 本地。用户配什么模型供应商,调用走那条路。如果配 OpenAI,prompt 当然到 OpenAI。chayuan-desktop 在前端明确显示当前模型(云 vs 本地),用户能看到 这次对话是不是发到外部。
完全闭环的方法。
方法一:模型用本地 Ollama 或 vLLM。
方法二:嵌入用本地 bge-m3-onnx(默认)。
方法三:重排用本地 bce-reranker(默认)。
方法四:OCR 用本地 RapidOCR(默认)。
方法五:向量库用本地 sqlite-vec(默认)或自建 Milvus。
方法六:业务数据库用自建(达梦、金仓在内网)。
方法七:所有外部源都接内网。
整套配下来 0 字节出域。
国产化支持下的不出域。政企等保合规要求严格。chayuan-desktop 的本地优先架构天然契合。
WPS AI 插件 chayuan-wps 的数据流跟 chayuan-desktop 一致。WPS 文档内容发给 sidecar,sidecar 在本地处理。不出 sidecar 范围。
数据落用户目录不出域是 chayuan-desktop 给用户的承诺。免费开源的AI软件 跟商业 SaaS 的根本差别就在这里。chayuan-desktop 在工程层面把这件事做扎实,让 隐私承诺 不只是口号。