OmniThink：浙大联合阿里通义开源 AI 写作框架，基于深度思考扩展知识边界，实时展示思考过程

2025-01-22 1065

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架，通过模拟人类迭代扩展和反思过程，生成高质量长篇文章，显著提升知识密度和内容深度。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日分享大模型与 AI 领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

正文（附运行示例）

OmniThink

OmniThink 是由浙江大学和阿里巴巴通义实验室联合开发的机器写作框架，旨在通过模拟人类的迭代扩展和反思过程，突破大型语言模型在机器写作中的知识边界。该框架通过信息树和概念池的结构化组织，逐步深化对主题的理解，生成高质量的长篇文章。

OmniThink 的核心优势在于其独特的迭代扩展和反思机制，能够有效提升生成文章的知识密度，减少冗余信息，同时保持文章的连贯性和深度。实验结果表明，OmniThink 在知识密度、内容丰富度和新颖性方面显著优于传统方法。

迭代扩展与反思机制：OmniThink 通过模拟人类学习者对主题的逐步深化理解，采用“反思-扩展”机制。在信息获取阶段，框架会分析已有的信息树节点，确定需要进一步扩展的节点，检索相关信息进行更新。随后，通过反思过程对新检索的信息进行分析、过滤和综合，提炼核心见解并更新概念池，为下一步扩展提供指导。
信息树与概念池构建：OmniThink 在信息获取阶段构建信息树和概念池。信息树用于组织和扩展主题相关的知识结构，概念池则存储核心概念和见解，使生成的文章更具逻辑性和深度。
知识密度优化：OmniThink 引入了“知识密度”指标，通过衡量生成文章中独特、有意义信息的比例，优化内容的质量和深度。框架基于 Factscore 工具与 GPT 模型相结合，对生成文章进行原子知识单元分解和去重处理，提升文章的信息丰富度。
模型无关性与灵活性：OmniThink 框架不依赖于特定的语言模型，可以与多种大型语言模型（LLM）集成，具有良好的通用性和扩展性。
多阶段生成流程：OmniThink 的生成流程分为信息获取、大纲构建和文章撰写三个阶段。首先通过迭代扩展和反思构建知识框架，然后生成大纲，最后根据大纲撰写连贯、高质量的文章。

首先，克隆 OmniThink 的 GitHub 仓库并安装依赖：

conda create -n OmniThink python=3.11
git clone https://github.com/zjunlp/OmniThink.git
cd OmniThink
pip install -r requirement.txt

在运行之前，需要设置 OpenAI 或 Dashscope 的 API 密钥以及搜索 API 密钥：

export OPENAI_API_KEY=YOUR_API_KEY
export SEARCHKEY=YOUR_SEARCHKEY

或者：

export DASHSCOPE_KEY=YOUR_API_KEY
export SEARCHKEY=YOUR_SEARCHKEY

只需运行以下命令即可生成文章：

sh run.sh

生成的文章、大纲和思维导图将保存在 ./results/ 目录下。

🥦 微信公众号｜搜一搜：蚝油菜花 🥦