开发者社区 问答 正文

什么是QPM?

什么是QPM?

展开
收起
代价码 2024-08-07 11:07:08 1163 分享 版权
1 条回答
写回答
取消 提交回答
  • QPM指的是"Queries Per Minute",即每分钟查询次数,它是衡量服务调用频率的一个指标

    在阿里云通义千问大模型的服务中,不同模型设定了不同的基础限流规则,其中包括了对QPM的限制

    例如,Qwen-Long模型的基础限流配置为每分钟调用次数不超过100 QPM,这意味着在默认情况下,用户每分钟通过API向Qwen-Long模型发起的请求不能超过这个数量,以确保服务的稳定性和公平性。

    如果用户的使用需求超过了这一限制,需要通过官方渠道申请提高限流配额。

    2024-08-07 11:31:12
    赞同 6 展开评论
问答地址: