开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

StructBERT文本相似度-中文-通用-base模型机器配置问题

我在试用StructBERT文本相似度-中文-通用-base这个模型,感觉效果还不错。我在1台8c32G(无gpu)的机器上搭建了一个docker的model scope环境(cpu版本),并对接http服务。完成一次相似度匹配的时间大概在800ms,cpu会占用到130%~150%。我想请问如果我想提升响应时间,比如缩短到400ms以内,应该使用什么配置的机器比较合适。1qps大概需要什么样的配置,谢谢!

展开
收起
czewl2c7v2cxa 2023-06-13 14:21:40 194 0
1 条回答
写回答
取消 提交回答
  • 有一些建议您可以参考: 1. 缩短sequence_length 2. 减小batchsize(如果是batch推理的话) 机器配置需要您自行测试一下,我们这里也并没有缩短到400ms以内的可靠数据

    2023-06-20 15:11:57
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载