开发者社区> 问答> 正文

qwen-long大模型如何实现多轮对话?

qwen-long大模型如何实现多轮对话?

展开
收起
我是三好学生 2024-07-19 17:47:48 277 0
2 条回答
写回答
取消 提交回答
  • Qwen-Long大模型实现多轮对话的方式主要依赖于系统消息(system message)中对文件ID(fileid)的管理和内容的引用,以及对上下文tokens的高效利用。以下是关键步骤和建议:

    1. 文件上传与ID获取
    • 首先,通过文件服务上传所有需要在对话中参考的文档,并为每个文档获取一个唯一的标识fileid
      2.. 初始化多轮对话
    • 在对话开始时,于system message中列出所有相关文档的fileid,格式如:'content': 'fileid://{file_1.id},fileid://{file_2.id}'。这样模型就能持续访问这些文件内容,支持上下文连贯的多轮对话。
      3.. 控制内容输入
    • 对于单文档对话,推荐使用fileid方式;若文档内容不超过1M tokens,可直接将内容置于system message中。
    • 不建议直接在user message中放入文档内容,因为其受9K tokens的长度限制。
      4.. 管理上下文大小
      • 注意Qwen-Long模型支持的最大上下文为10,000,000 tokens,包括问答历史和上传文档的总tokens数。设计对话流程时需考虑这一限制,以确保模型能有效利用上下文信息。 综上,通过策略性地在system message中引用fileid来引用外部文档内容,结合对输入内容大小的有效控制,Qwen-Long模型能够实现在多轮对话中维持和利用上下文信息的能力。
        参考链接;https://help.aliyun.com/zh/dashscope/developer-reference/api-details?spm=a2c4g.11186623.0.i46#ebcbe43126m3e
        image.png
    2024-07-21 19:04:52
    赞同 展开评论 打赏
    • 上下文容量:qwen-long模型支持最大10,000,000 tokens的对话窗口,涵盖问答历史与上传文档的总tokens数。\
    • 推荐实践:对于多文档或多轮对话场景,强烈推荐使用fileid引用方式,而非直接在消息中输入文档内容,以避免大文本输入的限制和优化对话体验。Qwen-Long通过系统设计支持文件ID引用和灵活的消息结构,有效实现了基于长文档、多文档的高效多轮对话功能。

    相关链接
    API详情 https://help.aliyun.com/zh/dashscope/developer-reference/qwen-long-api

    2024-07-19 19:59:15
    赞同 8 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载