备案控制台

开发者社区 ModelScope模型即服务正文

Qwen-7B-Chat长文本问答遇到问题？

短文本的问答是没有问题，根据说明文档，修改了use_dynamc_ntk和use_logn_attn为True，输入一个7000多长度的文本会报错维度不匹配。The size of tensor a (6144) must match the size of tensor b (6228) at non-singleton dimension 3，增大seq_length和n_positions后返回的结果为空

展开

收起

通义千问-7B-Chat

vzmyb6dsvbofu 2023-08-14 11:59:20 1224 版权

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

GPT-3.5模型有一个最大的序列长度限制，通常为2048或4096。如果你的输入文本长度超过了这个限制，你需要进行适当的处理。以下是一些可能的解决方案：

缩短文本：将文本长度缩短至模型限制范围内。你可以尝试截断文本，只保留关键信息或重要上下文。

分段输入：将长文本分割为较短的片段，然后逐段输入模型进行处理。你可以将多个问题和回答分别输入模型，并根据需要进行逐段交互。

上下文管理：对于长文本对话，适当管理上下文信息可能是有帮助的。你可以在每个回答之后将上下文信息传递给下一个请求，以保持对话的连贯性。

此外，你提到增大seq_length和n_positions后返回的结果为空。请注意，增加这些参数的值可能会增加模型的内存和计算需求。如果你的输入文本非常长，可能会导致内存不足或超出模型的处理能力。在调整这些参数时，需要根据你的系统资源和模型能力进行权衡。

2023-08-16 07:54:13

赞同展开评论

相关问答

idea插件-通义灵码-智能问答-建议代码高亮显示

212

1

0

vscode的通义插件的智能问答没有纵向滚动条，很不方便

388

7

0

Visual Studio 2019 通义灵码智能问答不支持上下文

88

1

0

通义灵码的智能问答不能全部复制，也不能搜索

86

1

0

使用通义灵码发现【智能问答】的生成结果展示有问题，导致代码不能方便复制到现有代码中去

86

1

0

通义灵码在Vs code的问答界面中字体很否设置大小

145

1

0

通义灵码在IDEA问答中字体太小，希望新增一个单独的字体大小设置

288

2

0

当我使用通义千问-7B-Chat模型与他对话询问他具体某人美不美时，他的问答如此机器，没有感情的对话

112

1

0

如何批量调用千问大模型进行问答？

167

1

0

为什么vscode里面安装通义灵码后，点击登录永远跳到开发者社区-问答-我要提问，不能登录，也不能使

115

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

ModelScope中，模型下载默认路径在哪个路径？

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

cpu部署报错 Torch not compiled with CUDA enabled

如何下载modelscope模型？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

调用Dashscope接口时报错

展开全部

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

通义DeepResearch全面开源！同步分享可落地的高阶Agent构建方法论

92_自我反思提示：输出迭代优化

139_剪枝优化：稀疏模型压缩 - 分析结构化剪枝的独特速度提升与LLM部署加速实践

132_API部署：FastAPI与现代安全架构深度解析与LLM服务化最佳实践

115_LLM基础模型架构设计：从Transformer到稀疏注意力

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

142_故障容错：冗余与回滚机制 - 配置多副本的独特健康检查

99_监督微调：Alpaca数据集格式与实现

展开全部

还有其他疑问?