开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr有没有什么办法可以优化一下,能够控制在1秒返回?

damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx这个模型,使用2pass模式,识别一句话的话,要2-3秒才返回,modelscope-funasr有没有什么办法可以优化一下,能够控制在1秒返回?

展开
收起
三分钟热度的鱼 2024-07-11 08:47:03 52 0
1 条回答
写回答
取消 提交回答
  • 为了提高damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx模型在使用2pass模式下的响应速度,达到1秒内返回识别结果的目标,可以考虑以下几个方面进行优化,尽管直接参考资料未提供针对此特定模型的优化策略,但以下建议基于一般ASR优化原则:

    1. 模型量化与优化

      • 尝试对模型进行量化处理,如INT8量化,这可以减少模型推理时的计算量和内存占用,从而加快推理速度[1]
      • 使用ONNX Runtime的优化工具进一步优化模型,如启用GPU加速、调整执行提供器设置等,以充分利用硬件资源[2]
    2. 推理引擎选择与调优

      • 确保使用了最新的ModelScope推理引擎或兼容的高性能推理框架,这些通常会针对最新硬件进行优化。
      • 调整推理引擎的并发设置、批处理大小等参数,合理分配计算资源,平衡延迟与吞吐量。
    2024-07-13 19:46:34
    赞同 3 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载