在 Coze(扣子)平台上建立知识库,是让 AI 智能体(Agent)拥有“专业知识”或“私有数据”的关键步骤。Coze 的流程设计非常直观,主要可以分为以下几个阶段。
- 创建知识库单元
首先,你需要进入 Coze 的工作台,在左侧菜单栏选择 “知识库” (Knowledge)。
点击创建: 点击“创建知识库”按钮。
设置基础信息: 为知识库命名(例如“XX产品手册”或“公司内部百科”),并添加描述。
选择类型: * 文本数据: 适用于 PDF、Word、TXT 或网页链接。
表格数据: 适用于 Excel、CSV,方便进行精准的行列查询。
- 数据导入与分段 (Chunking)
上传文件后,Coze 会引导你进行数据处理,这是决定搜索准确性的核心:
上传方式: 支持本地文件上传、在线网页爬取(输入 URL),甚至支持通过 API 自动同步。
分段设置: * 自动分段: Coze 会根据段落、标题自动切分。
手动分段: 如果你对内容布局有特殊要求,可以手动设置分割符。
清洗数据: 系统会自动剔除文档中的乱码或无效空格,你也可以在此阶段手动微调识别后的文本。
- 向量化与索引 (Embedding)
这一步是由平台自动完成的,但你需要做一些选择:
索引模式: * 全文检索: 关键词匹配。
向量检索: 语义匹配(即用户问法不同,但意思相近也能搜到)。
混合检索:(推荐) 结合以上两者,准确率最高。
确认入库: 点击确认后,Coze 会将你的文本转化为向量存储到数据库中。
- 召回测试与优化
在知识库正式使用前,你应该先测试它的“记性”好不好:
测试查询: 在知识库详情页的测试窗口输入问题。
查看召回: 观察系统找到了哪几段原文。如果找错了,可能需要重新调整分段逻辑或优化原始文档的结构。
- 将知识库挂载到 Agent
有了知识库,还需要把它“装进” AI 的脑袋里:
打开 Agent 编辑页: 进入你正在开发的智能体。
添加知识库: 在中间的“知识库”栏目点击 “+” 号,选择你刚刚创建好的库。
配置参数:
召回数量: 每次回答参考多少条知识片段(通常设置 3-5 条)。
最小相关度: 设置一个阈值,太不相关的匹配结果将被过滤。
- 配置 Prompt(提示词)
这是最后也是最重要的一步。你需要在 Agent 的 人设与回复逻辑 (Prompt) 中明确告诉它如何使用知识库。
示例 Prompt:
"你是一个资深的客服助手。请优先基于【知识库】中的内容回答用户问题。如果知识库中没有相关信息,请委婉地告知用户你不知道,不要胡乱猜测。"
- 进阶技巧
自动更新: 如果你的知识库来源是一个动态网页,可以设置“定时自动更新”,让 Agent 永远掌握最新信息。
多模态数据: 现在的 Coze 知识库也支持图片信息的处理(基于多模态大模型)。
你目前准备导入的是哪种类型的数据?是纯文字文档,还是带有很多参数的表格?