文档备案控制台

开发者社区问答正文

免费用户在使用阿里云大模型服务时，限流规则是怎么样的？

免费用户在使用阿里云大模型服务时，限流规则是怎么样的？

展开

收起

古月虎 2024-08-09 16:21:03 1042 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

邂逅青青

通义千问大语言模型为了保证用户调用模型的公平性，通义千问对于普通用户设置了基础限流。限流是基于模型维度的，并且和调用用户的阿里云主账号相关联，按照该账号下所有API-KEY调用该模型的总和计算限流。
如果超出调用限制，用户的API请求将会因为限流控制而失败，用户需要等待一段时间待满足限流条件后方能再次调用。

由于您的问题提供的信息较少，抱歉暂时无法准确解答您的疑问，你可以尝试提供更多信息来再次提问，以便我准确解答。

参考链接：https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-thousand-questions-metering-and-billing

2024-08-09 22:07:37

赞同 5 展开评论
请看我回答~

阿里云大降价~

不同的模型有些不太一样
gte-rerank模型限流规则:

调用频次不得高于 5 QPS（每秒钟不超过5次API调用）

Token消耗不得超过 10,000,000 TPM（每分钟消耗的Token数目不超过10,000,000）

通义千问Audio (qwen-audio-turbo)模型限流规则:

流量限流为 120 QPM（每分钟处理不超过120个完整的请求）

Token消耗限流为 100,000 TPM（每分钟消耗的Token数目不超过100,000）
参考文档

2024-08-09 17:50:59

赞同 1 展开评论

问答标签：

阿里云大模型阿里云大模型服务

问答地址：

开发者社区 > 云计算 > 问答

相关问答

通义灵码智能问答可以正常使用, 但在svn提交时生成提交信息会提示连接超时, 已经按照文档测试服务连

254

1

0

阿里云训练大模型的服务器类型选择建议？

481

1

0

阿里云部署DeepSeek 70B大模型配置推荐？

682

1

0

在哪里充钱了？在哪里计费了？阿里云和千问大模型能不能分开，好烂阿，这网页，一点也不简洁明了

674

1

0

在阿里云PAI-DSW完成微调的大模型，通过EAS部署为AI-web应用，如何开放为公网web应用

566

1

0

在阿里云maven的中心仓和公开仓都没有通义千问开发的jar是为什么？

422

1

0

已经登陆过阿里云但是通义灵码无法使用

203

0

0

阿里云语音AI TTS中cosyvoice大模型流式语音合成在并发的情况下，可共用一个token吗？

1023

2

0

ModelScope接口访问qwen-coder，报错409

471

0

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

520

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

动态变量话术引擎对直播有什么作用？

新手如何进行OSS 图片处理 CDN 加速？

什么年代了，qoder cn还不支持多agent协同一起完成任务

qoder 资源包买完找不到记录也不知道再用，究竟是谁设计的，没见过这样的设计，

需要支持自定义Kimi k3 API

相关解决方案

更多

通义灵码一站式定制专属MCP服务

零代码微调，打造领域专属大模型

千问与 LangChain 搭建对话服务

阿里云 Milvus 轻松实现文搜图&图搜图

对话分析，让服务更懂客户

还有其他疑问?