文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr高并发实时语音识别，36核，128g，拖40路很吃力有什么方案吗？

modelscope-funasr高并发实时语音识别，36核，128g，拖40路很吃力啊，cpu干爆了，200%，有什么方案吗？

展开

收起

三分钟热度的鱼 2024-03-20 15:45:06 1174 版权

2 条回答

写回答

取消提交回答

小Lee
在高并发实时语音识别场景下，如果发现36核、128GB内存配置的服务器在处理40路并发时CPU占用率高达200%，说明系统资源严重不足，存在几个可能的原因和相应的解决方案：
1. 模型优化：
  
  检查是否可以使用更高效的模型版本，如轻量级模型或者针对实时场景优化过的模型，以减少计算资源消耗。
  分布式部署：将负载分散到多个服务器上，每个服务器处理部分并发请求，这样可以通过横向扩展解决单机性能瓶颈。
2. 异步处理与队列化：
  
  使用消息队列服务，将实时识别任务异步化，避免直接阻塞和等待模型计算结果，这样可以提高系统的吞吐量，并减轻单台服务器的压力。
3. 硬件升级或增加实例：
  
  增加更多的CPU核心数，提升服务器的计算能力，或者增加更多内存来缓存计算中间结果，减少I/O瓶颈。
  如果是云计算环境，可以根据需求弹性扩容，增加多台服务器实例共同承担负载。
4. GPU加速：
  
  考虑采用GPU进行加速，很多深度学习模型在GPU上的计算效率远高于CPU，尤其是大型并行计算任务。
5. 服务拆分：
  
  将音频编码、解码、预处理等非核心步骤独立部署，减少主服务器的负担。
  对于特别耗时的后处理步骤（比如NLP理解、对话管理等），也可以考虑单独部署，只在识别完成后发送结果到后续服务处理。
6. 负载均衡：
  
  在集群环境下部署负载均衡器，合理分配流量至不同的服务器节点，确保资源有效利用且不会某一台机器过载。
7. 代码优化：
  
  检查现有代码是否存在低效算法或内存泄漏等问题，优化程序设计，减少不必要的计算和内存消耗。
根据具体的应用场景和技术架构选择合适的优化策略，可以有效地缓解高并发下的服务器压力，提高实时语音识别的服务质量和稳定性。联系阿里云技术支持获取针对ModelScope-FunASR在高并发场景下的最佳实践和官方指导也是非常重要的。
2024-03-20 16:42:25

赞同展开评论
圆不溜秋的小猫猫

建议你，io配置为4，线程池配置为36。并发控制在40以下。此回答整理自钉群“modelscope-funasr社区交流”

2024-03-20 15:56:49

赞同 1 展开评论

相关问答

modelscope-funasr的热词方案对热词的数量有要求吗，如果有上万个热词，这个方案还行吗？

446

1

0

modelscope-funasr的实时语音识别支持的并发数在哪里可以看？

522

1

0

modelscope-funasr系列，有直接输出srt格式的asr方案嘛？

275

1

0

modelscope 的实时语音通话案例，有类似的方案吗？

172

1

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

393

0

0

modelscope-funasr的多说话人语音识别模型支持实时听写吗？

282

0

0

在modelscope-funasr中有没有用做实时语音转文字的demo？

171

1

0

我使用modelscope进行语音识别时很慢。

709

0

0

在modelscope-funasr中官方实例语音识别pcm报错是什么问题?

156

0

0

ModelScope中，windows上有什么其他文本转语音的方案吗？

162

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

【深度建议】打破设备壁垒：关于通义千问实现“全平台智能语音交互”与“知识闭环”的五大核心建议

景区日接待量大：基于阿里云AI技术，智能语音机器人如何实现高峰期咨询自动分流与问题预判？

生成式人工智能驱动下的诈骗范式转移与防御机制研究

基于MATLAB的TDOA方法声源定位

AI 英语学习 APP的开发

热门讨论

热门文章

如何下载llama模型到本地？

关于通义千问Qwen-7B-Chat模型下载问题

modelscope-funasr 热词如何设置？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

通义灵码2.7.2版本智能体功能是不是用不了了，为何每次涉及到操作文件的问题都卡在那里不动了

modelscope-funasr的html客户端的地址如何更改？

modelscope-funasr的sensevoice-Large有开源计划吗？

modelscope-funasr输出的结果里可以区分说话人吗？

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Jina Reader：一键将网页内容转为适合 LLM 处理的文本格式，自动抓取和清洗网页内容，支持多种输出格式

OpenScholar：华盛顿大学联合艾伦研究所开源的学术搜索工具

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

写小说时，Claude 4.0 和 4.5 的差别在哪里？

展开全部

还有其他疑问?