备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

StructBERT文本相似度-中文-通用-base模型机器配置问题

我在试用StructBERT文本相似度-中文-通用-base这个模型，感觉效果还不错。我在1台8c32G（无gpu）的机器上搭建了一个docker的model scope环境（cpu版本），并对接http服务。完成一次相似度匹配的时间大概在800ms，cpu会占用到130%～150%。我想请问如果我想提升响应时间，比如缩短到400ms以内，应该使用什么配置的机器比较合适。1qps大概需要什么样的配置，谢谢！

展开

收起

StructBERT文本相似度-中文-通用-base

czewl2c7v2cxa 2023-06-13 14:21:40 260 版权

1 条回答

写回答

取消提交回答

1296995534731106

有一些建议您可以参考： 1. 缩短sequence_length 2. 减小batchsize（如果是batch推理的话）机器配置需要您自行测试一下，我们这里也并没有缩短到400ms以内的可靠数据

2023-06-20 15:11:57

赞同展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

2836

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82147

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

130991

28

0

计算机网络的频带传输是什么意思？

2006

1

0

this xml file does not appear to have any style in

50605

10

0

sql server的用户名和密码怎么查啊？

36630

21

0

OSS的endpoint如何查看

36979

6

0

手机弹出支付风险问题

6825

2

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60226

30

0

配置了安全组规则，端口还是无法访问

32867

25

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

Docker常用命令有哪些？掌握这些Docker命令，让容器管理事半功倍

HashiCorp Vault 镜像拉取与 Docker 部署全指南

Spring AI Alibaba、Dify、LangGraph 与 LangChain 综合对比分析报告

云原生NPM与传统NPM的差异

阿里云服务器通用算力型u2i实例详解：企业级性能保障，高性能算力

热门讨论

热门文章

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

练的pth模型文件，怎么转成bin文件？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr如何释放显存呢？

modelscope-funasr 热词如何设置？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

数据分析模型

modelscope-funasr这个进度条的日志去掉呢？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

FastExcel：开源的 JAVA 解析 Excel 工具，集成 AI 通过自然语言处理 Excel 文件，完全兼容 EasyExcel

展开全部

还有其他疑问?