开发者社区> 问答> 正文

通义千问不同模型的限流是多少?

通义千问不同模型的限流是多少?

展开
收起
人一月 2024-08-12 13:48:23 56 0
1 条回答
写回答
取消 提交回答
  • 通义千问不同模型的限流配置如下:

    1.通义千问110B (qwen1.5-110b-chat):

    • 流量限流:≤ 10 QPM(每分钟不超过10个请求)
    • Token消耗限流:≤ 20,000 TPM(每分钟不超过20,000 Tokens)
    1. 通用文本向量模型 (text-embedding-v1):
    • 调用频次限流:≤ 30 QPS(每秒不超过30次调用)
    • Token消耗限流:≤ 600,000 TPM(每分钟不超过600,000 Tokens)

    3.通义千问VL (qwen-vl-plus):

    • 流量限流:≤ 60 QPM(每分钟不超过60个请求)
    • Token消耗限流:≤ 100,000 TPM(每分钟不超过100,000 Tokens)

    4.qwen-vl-max:

    • 流量限流:≤ 15 QPM(每分钟不超过15个请求)
    • Token消耗限流:≤ 25,000 TPM(每分钟不超过25,000 Tokens)

    5.通义千问-Turbo (qwen-turbo):

    • 调用频次限流:≤ 500 QPM(每分钟不超过500次调用)
    • Token消耗限流:≤ 500,000 TPM(每分钟不超过500,000 Tokens)

    6.通义千问-Plus (qwen-plus):

    • 调用频次限流:≤ 200 QPM(每分钟不超过200次调用)
    • Token消耗限流:≤ 200,000 TPM(每分钟不超过200,000 Tokens)

    请注意,限流策略可能随时间和具体服务调整,请关注官方最新公告。

    参考链接:https://help.aliyun.com/zh/model-studio/developer-reference/tongyi-qianwen-llm/

    2024-08-12 15:24:35
    赞同 2 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载