8B 端侧写作智能体开源:DeepResearch,终于不必上云了

简介: 清华、人大等联合开源AgentCPM-Report:全球首个8B端侧深度研究智能体。无需上云,本地离线运行,支持万字级逻辑严密报告生成,实现检索—推理—写作闭环。在洞察力等关键指标上超越多数闭源模型,真正破解数据安全与深度研究不可兼得的难题。

长期以来,真正“深度”的研究型写作,一直被云端大模型垄断。

一边,是能力极强的闭源系统,能检索、能推理、能写万字长文; 另一边,是企业和研究机构越来越严苛的数据安全要求——核心资料不能出域、不能上云、不能被记录。

这几乎是一道无解的选择题。

直到最近,一个信号级别很高的项目出现了。

1 月 20 日,清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 社区联合开源了 8B 端侧写作智能体 AgentCPM-Report。它做了一件过去被认为“几乎不可能”的事:在完全本地部署的前提下,把 DeepResearch 级别的写作能力,压进了一个 8B 模型。

4ef67ba8-cfbf-47d5-8070-88ae32dd8bfc.png

一、为什么说这是一次“方向性”的突破
在深度研究场景中,问题从来不只是“模型大不大”。

真正困难的是三件事同时成立:

能长期、多轮检索与推理
能把碎片信息组织成严密的逻辑结构
能在长文本中保持一致性、洞察力和判断力
过去,这几乎等同于“必须上云 + 必须用闭源大模型”。

AgentCPM-Report 选择了一条完全不同的路线:不追求参数规模,而是把写作本身,当成一种推理过程来设计。

二、“以小博大”的核心机制:写作即推理
官方披露的数据很有意思:

单次任务中,平均进行约 40 轮深度检索
同时伴随 近 100 轮思维链推演
最终生成逻辑完整、可达万字规模的研究报告
关键不在“算得多”,而在算的方式被重构了。

AgentCPM-Report 并不是一次性“写完全文”,而是采用一种类似人类研究员的方式:

先起草结构和关键论点
再不断回溯、补证据、细化逻辑
通过“起草 → 深化 → 校正”的循环,把长写作拆解成一系列可控的小目标
这种设计,极大降低了小模型在长文本中“逻辑崩塌”的概率。

三、端侧部署,真正解决的是“物理级安全”
另一个被反复强调的点,是完全离线、本地运行。

AgentCPM-Report 从设计之初,就面向高隐私场景:

无需云端调用
不上传任何数据
本地知识库“只进不出”
它基于开源的 UltraRAG 框架,可以直接挂载企业内部的 PDF、TXT、报告、制度文件,自动完成切片、索引和向量化。

这意味着一件很重要的事:

深度研究能力,第一次可以被安全地放进“内网”。

对企业研究、合规分析、战略咨询、内部智库来说,这不是性能优化,而是可不可以用的区别。

四、评测结果:在“洞察力”上击败闭源系统
在多个主流深度调研评测基准中,AgentCPM-Report 的成绩相当激进:

DeepResearch Bench
Deep Consult
DeepResearch Gym
尤其在 洞察性指标 上排名第一,在全面性上进入第一梯队,仅略低于基于 Claude 的复杂写作系统。

在 DeepResearch Gym 中,它的综合得分达到 98.48,在深度、广度、洞察力等关键维度全部拿到满分。

这基本坐实了一件事:端侧模型,已经开始正面进入“高阶认知任务”的战场。

五、从 Demo 到生产:部署门槛被拉到极低
从工程视角看,这个项目并不“学院派”。

支持 Docker 一键启动
不需要写代码
本地文档直接拖拽导入
自动完成切片、索引、引用标注
用户只需要输入研究主题,就能得到一份结构清晰、可溯源的专业报告。

官方还展示了一个很“残忍”的案例: 基于《三体》原文知识库,自动完成“面壁计划”的深度研究报告,从线索挖掘到万字成文,全流程自动完成。

这已经不是简单的写作辅助,而是完整的研究工作流自动化。

六、这意味着什么?
AgentCPM-Report 真正重要的,并不是“又一个模型开源了”。

而是它释放了一个清晰信号:

DeepResearch 不再是云端特权
小模型 + 智能体架构,开始挑战高阶认知任务
本地化、可控、可审计的 AI 研究系统,正在成为现实选项
接下来,问题可能不再是“能不能做到”,而是:

谁会最先把这种能力,用进真实业务里。

相关文章
|
2天前
|
人工智能 自然语言处理 Shell
🦞 如何在 Moltbot 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
🦞 如何在 Moltbot 配置阿里云百炼 API
|
6天前
|
人工智能 API 开发者
Claude Code 国内保姆级使用指南:实测 GLM-4.7 与 Claude Opus 4.5 全方案解
Claude Code是Anthropic推出的编程AI代理工具。2026年国内开发者可通过配置`ANTHROPIC_BASE_URL`实现本地化接入:①极速平替——用Qwen Code v0.5.0或GLM-4.7,毫秒响应,适合日常编码;②满血原版——经灵芽API中转调用Claude Opus 4.5,胜任复杂架构与深度推理。
|
10天前
|
JSON API 数据格式
OpenCode入门使用教程
本教程介绍如何通过安装OpenCode并配置Canopy Wave API来使用开源模型。首先全局安装OpenCode,然后设置API密钥并创建配置文件,最后在控制台中连接模型并开始交互。
4580 8
|
16天前
|
人工智能 JavaScript Linux
【Claude Code 全攻略】终端AI编程助手从入门到进阶(2026最新版)
Claude Code是Anthropic推出的终端原生AI编程助手,支持40+语言、200k超长上下文,无需切换IDE即可实现代码生成、调试、项目导航与自动化任务。本文详解其安装配置、四大核心功能及进阶技巧,助你全面提升开发效率,搭配GitHub Copilot使用更佳。
10382 21
|
3天前
|
人工智能 自然语言处理 Cloud Native
大模型应用落地实战:从Clawdbot到实在Agent,如何构建企业级自动化闭环?
2026年初,开源AI Agent Clawdbot爆火,以“自由意志”打破被动交互,寄生社交软件主动服务。它解决“听与说”,却缺“手与脚”:硅谷Manus走API原生路线,云端自主执行;中国实在Agent则用屏幕语义理解,在封闭系统中精准操作。三者协同,正构建AI真正干活的三位一体生态。
2332 9
|
1天前
|
存储 安全 数据库
使用 Docker 部署 Clawdbot(官方推荐方式)
Clawdbot 是一款开源、本地运行的个人AI助手,支持 WhatsApp、Telegram、Slack 等十余种通信渠道,兼容 macOS/iOS/Android,可渲染实时 Canvas 界面。本文提供基于 Docker Compose 的生产级部署指南,涵盖安全配置、持久化、备份、监控等关键运维实践(官方无预构建镜像,需源码本地构建)。
1220 2
|
1天前
|
机器人 API 数据安全/隐私保护
只需3步,无影云电脑一键部署Moltbot(Clawdbot)
本指南详解Moltbot(Clawdbot)部署全流程:一、购买无影云电脑Moltbot专属套餐(含2000核时);二、下载客户端并配置百炼API Key、钉钉APP KEY及QQ通道;三、验证钉钉/群聊交互。支持多端,7×24运行可关闭休眠。
|
17天前
|
存储 人工智能 自然语言处理
OpenSpec技术规范+实例应用
OpenSpec 是面向 AI 智能体的轻量级规范驱动开发框架,通过“提案-审查-实施-归档”工作流,解决 AI 编程中的需求偏移与不可预测性问题。它以机器可读的规范为“单一真相源”,将模糊提示转化为可落地的工程实践,助力开发者高效构建稳定、可审计的生产级系统,实现从“凭感觉聊天”到“按规范开发”的跃迁。
2595 18
|
10天前
|
人工智能 前端开发 Docker
Huobao Drama 开源短剧生成平台:从剧本到视频
Huobao Drama 是一个基于 Go + Vue3 的开源 AI 短剧自动化生成平台,支持剧本解析、角色与分镜生成、图生视频及剪辑合成,覆盖短剧生产全链路。内置角色管理、分镜设计、视频合成、任务追踪等功能,支持本地部署与多模型接入(如 OpenAI、Ollama、火山等),搭配 FFmpeg 实现高效视频处理,适用于短剧工作流验证与自建 AI 创作后台。
1387 5