文档备案控制台

开发者社区问答正文

通义千问大模型的并发限制具体情况有具体介绍么？

通义千问大模型的并发限制具体情况有具体介绍么？

展开

收起

我是三好学生 2024-07-22 12:06:16 2718 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

游客jksuoh6647qgg

付费可以提升大模型的并发吗？

2024-12-24 21:24:51

赞同展开评论
圆葱猪肉包

为了保证用户调用模型的公平性，通义千问对于普通用户设置了基础限流。限流是基于模型维度的，并且和调用用户的阿里云主账号相关联，按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制，用户的API请求将会因为限流控制而失败，用户需要等待一段时间待满足限流条件后方能再次调用。通义千问大模型的并发限制具体情况如下：

qwen-long ：调用频次 ≤ 100 QPM，每分钟不超过100次API调用； Token消耗暂无限制。

qwen-turbo ：调用频次 ≤ 500 QPM，每分钟不超过500次API调用； Token消耗 ≤ 500,000 TPM，每分钟消耗的token数目不超过500,000。

qwen-turbo-0624、qwen-turbo-0206 ：调用频次 ≤ 60 QPM，每分钟不超过60次API调用； Token消耗 ≤ 60,000 TPM，每分钟消耗的token数目不超过60,000。

qwen-plus ：调用频次 ≤ 200 QPM，每分钟不超过200次API调用； Token消耗 ≤ 200,000 TPM，每分钟消耗的token数目不超过200,000。

qwen-plus-0624、qwen-plus-0206 ：调用频次 ≤ 60 QPM，每分钟不超过60次API调用； Tok

2024-07-22 13:42:52

赞同 5 展开评论

问答地址：

开发者社区 > 云计算 > 问答

相关问答

请问语音大模型Qwen-ASR是否支持输出字级别的时间戳？

345

0

0

普通轻薄本能跑哪些多模态大模型

427

1

0

使用 dashscope-sdk-java 调用qwen3-max-preview模型回答问题，没有

330

0

0

qwen-v1-ocr如何训练？预置模型里没有这个选项

120

0

0

C-MTEB评估qwen模型

279

0

0

加载Qwen/Qwen-7B-Chat模型报错

342

0

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

2248

1

0

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

2659

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

6055

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

1913

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

2026年速看！阿里云大模型Qwen3.5 - Omni介绍及活动一览

2026年一文读懂：阿里云大模型Qwen3.6 - Plus是啥，还有优惠介绍

2026年深度解读：阿里云千问大模型（AI大模型）介绍及优惠活动详细说明

2026年阿里云千问大模型介绍，AI大模型奥秘与优惠活动说明

2026年阿里云千问大模型深度介绍：涵盖产品特性与优惠活动汇总

相关解决方案

更多

零代码微调，打造领域专属大模型

触手可及，函数计算玩转 AI 大模型

告别低效沟通，使用大模型发起语音通话

构建大模型应用的安全防护体系

Kimi K2.5，开源万亿参数大模型

还有其他疑问?