本地离线知识库的隐私底线 数据落用户目录不出域,察元AI还超级智能体

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: 察元AI桌面版坚守“数据不出域”核心承诺:所有对话、知识库、文件、密钥、日志均本地存储(CHAYUAN_ROOT下),默认禁用遥测,Sidecar绑定127.0.0.1,模型密钥强加密。支持Ollama等本地模型实现完全闭环,0字节外传,满足政企等保与国产化合规要求。(239字)

察元AI还超级智能体 桌面单机版的核心隐私承诺:所有数据落在用户目录,不出域。这一篇讲实现。

承诺的具体含义。

具体一:对话历史在本地。所有 LLM 对话在 CHAYUAN_ROOT/data 的 SQLite 文件。不上传任何云。

具体二:知识库在本地。doc:* 文档库的 chunk 跟向量在 CHAYUAN_ROOT/vectors。不上传。

具体三:上传的原文件在本地。CHAYUAN_ROOT/uploads。不上传。

具体四:模型钥匙在本地。CHAYUAN_ROOT/credentials 加密存。不上传。

具体五:诊断日志在本地。CHAYUAN_ROOT/logs。不上传。

例外。LLM 调用本身。如果用户用云端模型(OpenAI、文心等),prompt(含 chunk 内容)发到厂商云。这部分不可避免。如果用户在意,用本地推理(Ollama)即可完全闭环。

工程实现。

实现一:sidecar 默认绑 127.0.0.1。外部网络访问不到。

实现二:禁用任何 默认 telemetry。chayuan-desktop 不发使用统计、不发 crash report 到云端(除非用户主动开 Langfuse 接入)。

实现三:模型钥匙加密。Stronghold + ChaCha20。

实现四:Tauri 配置 capability 限制。前端能调的 native API 严格白名单。

CLAUDE.md 里的红线。

红线一:不在查询阶段允许前端覆盖 embedding 模型。

红线二:vector / source 结果不能展示成 可下载文档附件 误导用户。

红线三:未验证就提交或推送代码。

红线四:没有权限校验就访问 KB / source。

红线五:在路由文件里继续堆大段业务 dispatch。

这些规则保护数据完整性和合规性。

跟厂商云模型的关系。chayuan-desktop 不替用户选 云端 vs 本地。用户配什么模型供应商,调用走那条路。如果配 OpenAI,prompt 当然到 OpenAI。chayuan-desktop 在前端明确显示当前模型(云 vs 本地),用户能看到 这次对话是不是发到外部。

完全闭环的方法。

方法一:模型用本地 Ollama 或 vLLM。

方法二:嵌入用本地 bge-m3-onnx(默认)。

方法三:重排用本地 bce-reranker(默认)。

方法四:OCR 用本地 RapidOCR(默认)。

方法五:向量库用本地 sqlite-vec(默认)或自建 Milvus。

方法六:业务数据库用自建(达梦、金仓在内网)。

方法七:所有外部源都接内网。

整套配下来 0 字节出域。

国产化支持下的不出域。政企等保合规要求严格。chayuan-desktop 的本地优先架构天然契合。

WPS AI 插件 chayuan-wps 的数据流跟 chayuan-desktop 一致。WPS 文档内容发给 sidecar,sidecar 在本地处理。不出 sidecar 范围。

数据落用户目录不出域是 chayuan-desktop 给用户的承诺。免费开源的AI软件 跟商业 SaaS 的根本差别就在这里。chayuan-desktop 在工程层面把这件事做扎实,让 隐私承诺 不只是口号。

相关文章
|
22天前
|
算法 NoSQL Java
Java在分布式ID生成器(雪花算法)中的实现与优化
在分布式系统中,需要全局唯一、趋势递增、高性能的ID(如订单号、消息ID)。数据库自增ID在分库分表后不再唯一;UUID无序且过长,影响索引性能。
250 1
|
Linux C++ Windows
c++ 通过域名获取ip(跨平台)
c++ 通过域名获取ip(跨平台)
1442 0
|
22天前
|
存储 人工智能 运维
千亿级 AI 搜索的效能实战:从混合检索到 Agentic RAG 的三年实战
本文为2026 Elastic中国大会演讲实录,直击千亿级AI搜索三大挑战:搜索融合(关键词+向量+稀疏检索原生一体)、极致效能(冷热分层、硬件降级、自研FalconSeek引擎)与Agentic RAG演进(结构化知识图谱+智能体自主推理),揭示企业级AI搜索从“能用”到“好用”再到“自进化”的实战路径。
423 8
|
22天前
|
监控 固态存储 Java
Maven 本地仓库优化:SSD+ 目录结构调整最佳实践
本文深入讲解了 Maven 本地仓库优化的完整方案,包含 SSD 迁移、目录结构规划、清理策略、多版本管理等企业级最佳实践。通过真实案例展示了如何将 50GB 仓库优化到 20GB(减少 60%),构建时间从 12 分钟缩短到 2 分钟(提升 6 倍)。提供完整的迁移脚本、清理工具和监控方案,帮助开发者解决磁盘空间不足、I/O 性能瓶颈等问题。适合 Java 开发者、DevOps 工程师阅读。
|
22天前
|
人工智能 开发工具 git
Claude Code新手零基础入门教程:安装配置、国产模型接入与常用命令全集
在AI编程工具快速迭代的当下,传统代码补全插件已经无法满足复杂开发需求,而**Claude Code**凭借终端原生、任务驱动、轻量高效、多模型兼容的独特优势,成为开发者首选的智能编程助手。它不需要依赖笨重的IDE插件,全程在终端运行,能够自主理解项目需求、拆解开发任务、生成代码、修改文件、执行终端命令、管理Git版本仓库,覆盖从项目初始化、代码编写、Bug修复到项目重构的全流程开发工作。
679 3
|
22天前
|
人工智能 缓存 安全
阿里云百炼:重磅发布Qwen3.7 Max 面向智能体时代的新一代旗舰模型
阿里云百炼重磅发布Qwen3.7-Max旗舰大模型,面向智能体时代,支持100万tokens超长上下文、30K RPM高并发,具备卓越编程能力、MCP集成与长周期自主执行能力。现推理后付费限时5折,新用户可免费试用100万Tokens。开百炼免费体验:https://t.aliyun.com/U/fPVHqY
|
22天前
|
缓存 前端开发 安全
ReAct推理链的工程化实现与最佳实践
本文介绍向量空间JBoltAI平台基于Spring Boot 3.x与Java 21实现的企业级ReAct推理链架构,涵盖分层设计、模板方法、Function Calling驱动、并发安全机制及推理可视化等核心实践,助力LLM能力可靠落地。
|
22天前
|
人工智能 安全 算法
GEO 行业大清洗:倒闭的不是公司,是整个行业的投机小聪明
本文深度剖析GEO行业2026年集体暴雷的根源:AI技术迭代彻底颠覆旧有商业逻辑。指出虚假繁荣源于信息差红利,而今算法升级、监管加码与品牌认知觉醒共同终结“铺量套利”模式。文章穿透表象,从商业本质、技术底层、人性痛点、产业终局四维拆解,宣告低端中介退场,真GEO已升级为以AI认知基建、品牌信用沉淀为核心的高价值赛道。(239字)
|
22天前
|
人工智能 JSON 定位技术
GEO站内优化深度指南:内容、JSON-LD与知识地图FAQ
本文将围绕于磊老师的这一理论框架,深入探讨GEO站内优化的核心策略,特别是内容设置、JSON-LD应用以及知识地图构建等关键环节,以FAQ形式为读者提供专业、可信、有深度的指导。
135 2
|
22天前
|
存储 关系型数据库 MySQL
MySQL索引底层原理:B+树能存多少数据?页分裂与回表机制详解
数据库小学妹带你深入B+树底层:为何选它而非二叉树或哈希?揭秘页分裂/合并机制、聚簇与二级索引差异、回表代价及磁盘I/O优化逻辑。3层B+树可存约800万数据,查询仅需3次I/O!

热门文章

最新文章