开发者社区> 问答> 正文

什么是QPM?

什么是QPM?

展开
收起
代价码 2024-08-07 11:07:08 471 0
1 条回答
写回答
取消 提交回答
  • QPM指的是"Queries Per Minute",即每分钟查询次数,它是衡量服务调用频率的一个指标

    在阿里云通义千问大模型的服务中,不同模型设定了不同的基础限流规则,其中包括了对QPM的限制

    例如,Qwen-Long模型的基础限流配置为每分钟调用次数不超过100 QPM,这意味着在默认情况下,用户每分钟通过API向Qwen-Long模型发起的请求不能超过这个数量,以确保服务的稳定性和公平性。

    如果用户的使用需求超过了这一限制,需要通过官方渠道申请提高限流配额。

    2024-08-07 11:31:12
    赞同 6 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载