文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

NER模型使用pipeline方式进行模型推理速度太慢

NER模型使用pipeline方式进行模型推理速度太慢1条大概3S，不太适合进行线上部署，有没有什么解决办法？

展开

收起

caicaicaij 2023-03-08 16:59:51 739 版权

2 条回答

写回答

取消提交回答

游客t4qzlg5d5btxi

我猜你用的是CPU进行推理，我最开始用的CPU也是一条差不多4～5S，后来用的3060Ti，差不多5000条，30秒

2023-04-12 16:16:32

赞同展开评论
pangdahs
有几种解决方案可以尝试一下：
1. 使用GPU进行模型推理
2. 多条query以batch的方式批量处理（仅GPU下有性能提升）
3. 使用小模型，部分NER模型有LSTM版本可以使用
4. 将模型导出为onnx格式进行推理（1.4版本后支持）
2023-03-22 17:23:38

赞同 1 展开评论

相关问答

自然语言处理

在机器学习PAI中，训练了一个 dssm 模型，感觉负采样没有生效，这是为什么?

119

1

0

ModelScope中，以本地模型为原型训练模型怎么实现，能用.gguf格式的模型训练吗？

203

1

0

机器学习PAI模型特征的配置，这个信息是怎么传给线上的呢？

140

1

0

我使用机器学习PAI easyRec中的dssm模型做召回，要使用其中的负采样版本怎么办？

143

1

0

阿里云的人工智能平台PAI与大模型服务平台在功能定位和服务范围上有不同么？

145

0

0

机器学习PAI如果保存结果模型，为了在另外一个流程中直接导入使用？

147

1

0

机器学习PAI这个如果保存结果模型，可以在另外一个流程中直接导入使用吗？

142

1

0

机器学习PAI这个文档中的镜像已经没有了？

93

1

0

机器学习PAI 1千万的数据量不知道需要多少资源?

155

1

0

机器学习PAI如果原始特征title时：“easyrec用的顶呱呱”，这样输入对吧？

163

2

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

[大模型实战 05] 大模型实战的杀手锏：模型微调

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

热门讨论

热门文章

通义灵码2.7.2版本智能体功能是不是用不了了，为何每次涉及到操作文件的问题都卡在那里不动了

modelscope-funasr 热词如何设置？

运行模型时报错 'megatron_util.mpu' has no attribute 'get_

如何下载llama模型到本地？

modelscope-funasr支持粤语么？

###baichuan-7B 进行中文分词效果

modelscope-funasr如何释放显存呢？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

gpt3,加载数据时，MsDataset.load报错

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

OpenScholar：华盛顿大学联合艾伦研究所开源的学术搜索工具

[大模型实战 03] 拆解 Transformers：从原理图解到 HuggingFace Transformers 实战

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

[大模型实战 05] 大模型实战的杀手锏：模型微调

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

展开全部

还有其他疑问?