8B端侧智能写作体开源:DeepResearch,让您告别云端依赖

简介: 当深度研究能力被云端大模型垄断,企业却面临数据无法出域的安全禁令,这曾是一道无解的选择题。直到最近,清华大学、面壁智能等联合开源了仅8B参数却具备深度研究写作能力的智能体。它在完全本地部署的前提下,通过重构“写作即推理”的底层机制,首次将闭源云端模型的深度分析能力带入了内网,为高保密场景下的自动化研究打开了新局面。

长期以来,真正“深度”的研究型写作,一直被云端大模型垄断。

一边,是能力极强的闭源系统,能检索、能推理、能写万字长文; 另一边,是企业和研究机构越来越严苛的数据安全要求——核心资料不能出域、不能上云、不能被记录。

这几乎是一道无解的选择题。

直到最近,一个信号级别很高的项目出现了。

1 月 20 日,清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 社区联合开源了 8B 端侧写作智能体 AgentCPM-Report。它做了一件过去被认为“几乎不可能”的事:在完全本地部署的前提下,把 DeepResearch 级别的写作能力,压进了一个 8B 模型。

image.png


一、为什么说这是一次“方向性”的突破

在深度研究场景中,问题从来不只是“模型大不大”。

真正困难的是三件事同时成立:

  • 能长期、多轮检索与推理
  • 能把碎片信息组织成严密的逻辑结构
  • 能在长文本中保持一致性、洞察力和判断力

过去,这几乎等同于“必须上云 + 必须用闭源大模型”。

AgentCPM-Report 选择了一条完全不同的路线:不追求参数规模,而是把写作本身,当成一种推理过程来设计。


二、“以小博大”的核心机制:写作即推理

官方披露的数据很有意思:

  • 单次任务中,平均进行约 40 轮深度检索
  • 同时伴随 近 100 轮思维链推演
  • 最终生成逻辑完整、可达万字规模的研究报告

关键不在“算得多”,而在算的方式被重构了

AgentCPM-Report 并不是一次性“写完全文”,而是采用一种类似人类研究员的方式:

  • 先起草结构和关键论点
  • 再不断回溯、补证据、细化逻辑
  • 通过“起草 → 深化 → 校正”的循环,把长写作拆解成一系列可控的小目标

这种设计,极大降低了小模型在长文本中“逻辑崩塌”的概率。


三、端侧部署,真正解决的是“物理级安全”

另一个被反复强调的点,是完全离线、本地运行

AgentCPM-Report 从设计之初,就面向高隐私场景:

  • 无需云端调用
  • 不上传任何数据
  • 本地知识库“只进不出”

它基于开源的 UltraRAG 框架,可以直接挂载企业内部的 PDF、TXT、报告、制度文件,自动完成切片、索引和向量化。

这意味着一件很重要的事:

深度研究能力,第一次可以被安全地放进“内网”。

对企业研究、合规分析、战略咨询、内部智库来说,这不是性能优化,而是可不可以用的区别。


四、评测结果:在“洞察力”上击败闭源系统

在多个主流深度调研评测基准中,AgentCPM-Report 的成绩相当激进:

  • DeepResearch Bench
  • Deep Consult
  • DeepResearch Gym

尤其在 洞察性指标 上排名第一,在全面性上进入第一梯队,仅略低于基于 Claude 的复杂写作系统。

在 DeepResearch Gym 中,它的综合得分达到 98.48,在深度、广度、洞察力等关键维度全部拿到满分。

这基本坐实了一件事:端侧模型,已经开始正面进入“高阶认知任务”的战场。


五、从 Demo 到生产:部署门槛被拉到极低

从工程视角看,这个项目并不“学院派”。

  • 支持 Docker 一键启动
  • 不需要写代码
  • 本地文档直接拖拽导入
  • 自动完成切片、索引、引用标注

用户只需要输入研究主题,就能得到一份结构清晰、可溯源的专业报告。

官方还展示了一个很“残忍”的案例: 基于《三体》原文知识库,自动完成“面壁计划”的深度研究报告,从线索挖掘到万字成文,全流程自动完成。

这已经不是简单的写作辅助,而是完整的研究工作流自动化


六、这意味着什么?

AgentCPM-Report 真正重要的,并不是“又一个模型开源了”。

而是它释放了一个清晰信号:

  • DeepResearch 不再是云端特权
  • 小模型 + 智能体架构,开始挑战高阶认知任务
  • 本地化、可控、可审计的 AI 研究系统,正在成为现实选项

接下来,问题可能不再是“能不能做到”,而是:

谁会最先把这种能力,用进真实业务里。


开源地址汇总(原项目):


相关文章
|
7月前
|
存储 前端开发 Java
基于Spring AI Alibaba 的 DeepResearch 架构与实践
基于SpringAI Alibaba Graph构建的Java版DeepResearch系统,实现信息搜集、分析到结构化报告生成的全自动流程。支持多轮推理、RAG检索、MCP扩展、可观测性及可溯源输出,集成主流搜索工具与多种数据源,具备高可扩展性与企业级应用能力。
基于Spring AI Alibaba 的 DeepResearch 架构与实践
|
2月前
|
Linux API 网络安全
OpenClaw阿里云轻量服务器+本地部署与模型接入实战:千问/Coding Plan配置及常见问题解答
OpenClaw(原Clawdbot)作为2026年主流开源AI智能体运行框架,可实现文本处理、流程自动化、内容生成、信息检索、任务调度等多类工作流能力,在个人使用与小型团队场景中广泛应用。其核心优势在于支持本地私有化部署、云端托管运行,可灵活对接各类大模型接口,实现低成本与高可控的AI能力调用。当前使用者普遍面临两大核心问题:一是云端部署流程不清晰,在服务器选购、系统配置、端口放行、服务自启等环节频繁出错;二是本地环境跨平台兼容性复杂,MacOS、Linux、Windows11系统的依赖安装、环境配置、权限处理存在大量差异点;三是模型API接入配置繁琐,阿里云千问系列模型与免费Coding
476 0
|
7月前
|
并行计算 测试技术 异构计算
Qwen3 Next 在 TensorRT LLM 上的部署指南
本指南介绍如何在TensorRT LLM框架上部署Qwen3-Next-80B-A3B-Thinking模型,基于默认配置实现快速部署。涵盖环境准备、Docker容器启动、服务器配置与性能测试,支持BF16精度及MoE模型优化,适用于NVIDIA Hopper/Blackwell架构GPU。
1626 154
|
存储 机器学习/深度学习 人工智能
创新场景丨小鹏汽车:端到端智驾真正竞赛在云端
算力上的提前布局,让小鹏汽车在国内率先实现端到端智能驾驶大模型量产上车。小鹏汽车认为,端到端只是开始,不是终局,真正的竞赛正在云端展开,云端大模型才是制胜关键。拥有强大算力的阿里云,支撑小鹏汽车端到端大模型的快速迭代。
|
1月前
|
数据采集 人工智能 IDE
阿里云Coding Plan详解、订阅价格、售罄解决方法及常见问题解答FAQ,你关心的问题都在这!
阿里云Coding Plan是百炼推出的AI编程套餐,CodingPlan官网:https://t.aliyun.com/U/G7pldC 月付200元(首月39.9元),含9万次API调用额度,支持Qwen、GLM、Kimi等主流模型及Cursor、Claude Code等工具。仅Pro套餐开放,固定月费、用完即停、不转按量计费。严禁共享Key、自动化调用或非编程用途。
|
6月前
|
SQL 自然语言处理 BI
万字长文解析 NLQ 破局 Text2SQL,兼得灵活复杂准确
润乾NLQ创新采用“规范文本”作中间层,兼顾问题灵活性与查询准确性。通过人类可读的规范文本确认意图,结合规则引擎生成精确SQL,并支持复杂查询,以低成本实现企业级Text2SQL的可靠落地,突破传统三难困境。
|
存储 人工智能 搜索推荐
Spring AI Alibaba DeepResearch源码解读
DeepResearch是SAA社区推出的智能体项目,支持复杂信息搜索、分析与结构化报告生成。其基于Graph构建14个协同节点(如Coordinator、Planner、Researcher等),融合Plan & Execute、LLM Reflection、Hybrid RAG、Self-evolving角色记忆、HITL等前沿技术,实现端到端深度研究自动化
676 13
Spring AI Alibaba DeepResearch源码解读
|
4月前
|
人工智能 应用服务中间件 API
🦞 Clawdbot(Moltbot)云服务AI助手,阿里云一键部署配置步骤流程
Moltbot(原Clawdbot)是一款开源的本地优先AI代理与自动化平台,能够将多渠道通信能力与大语言模型深度集成,帮助用户创建具备持久记忆和主动执行能力的定制化AI助理。为简化部署流程,阿里云推出了Moltbot全套云服务,支持一键快速部署,让AI助手实现24小时不间断运行,适用于个人开发者和企业团队构建智能化应用。本文将详细拆解部署全流程,确保不改变原意且无营销表述,帮助用户高效完成配置。
1322 3
|
4月前
|
人工智能 安全 应用服务中间件
阿里云 Moltbot(原 Clawdbot)全套云服务介绍、部署步骤与使用指南
Moltbot(原Clawdbot)是由PSPDFKit Labs开发的开源自托管AI智能体(AI Agent),核心定位为“可自主执行任务的AI助手”,区别于传统问答式AI工具,其具备屏幕感知、任务规划、操作执行与状态验证的全链路能力,可7×24小时运行在服务器或终端设备上,通过自然语言指令自动完成文件管理、日程安排、邮件处理、代码编写、跨应用协同等自动化任务,数据优先存储于用户自有节点,隐私可控。2026年,阿里云正式上线Moltbot全套云服务,整合轻量应用服务器、无影云电脑、百炼大模型平台等核心资源,提供预置镜像、一键部署、安全优化等全流程支持,大幅降低部署门槛,适配个人、小型团队及企
4546 9