备案控制台

开发者社区 > ModelScope模型即服务 > 语音 > 正文

cpu（gpu）资源消耗过高，无法支撑并发推理

很多训练模型都存在一个问题，就是资源消耗过大，而且无法有效多并发推理，经测试，语音识别和语音合成，多并发情况下（2并发～20并发），随着并发增加，推理耗时就会呈线性趋势增加，比如同等条件下，一个并发耗时400ms，如果并发加到10，单次最大耗时将增加到4秒左右，增加到20并发，则耗时增加到8秒左右，同理语音合成也是一样，当单并发耗时1-2秒，20并发的单次最大耗时将达到40～60秒，请问有什么方式在有限资源情况下优化提高并发量，谢谢

展开

收起

1030541127660846 2022-11-25 16:45:00 1470 0

1 条回答

写回答

取消提交回答

达摩院智捷

ModelScope主要展示是模型本身，以模型的功能、背后的算法、精度等为主要。您提到的并发问题，实际是将模型变成一个推理服务（通常以API的形式提供）时所要重点考虑的。假设给定模型本身的结构不变，一个好的推理服务就是要能够考虑并发、延迟等成本体验指标。这里有一些通用的手段是一般会考虑的，包括提高单线程效率（例如优化合并模型的图结构，优化向量运算至矩阵预算并使用更好的矩阵库）、充分利用多线程（例如使用线程池来并行处理多并发、分拆模型只读内存和推理中间过程的动态内存）等手段。最极致的优化甚至可以做到手撸AVX intrinsics的地步。阿里云公共云智能语音交互的语音识别、语音合成API，其背后的核心引擎就是用上述这些手段来优化并发的。

2022-11-25 20:36:24

赞同 2 展开评论打赏

相关问答

阿里云为解决MySQL在云上CPU资源利用率低和单线程查询处理的问题，推出了什么功能？

44

1

0

PolarDB提出了什么架构来解决CPU、内存和存储资源的问题？

47

1

0

云上MySQL实例的CPU资源利用率普遍如何？这对业务有什么影响？

21

1

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

37

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的是一样的么？

40

0

0

higress 部署需要的k8s资源是多少？（多少cpu和内容）

60

1

0

flink cdc同步数据的资源，比如内存，cpu这些有什么参考依据吗？

58

12

0

ModelScope中示例页面的GPU版本和CPU版本。这两个不同版本会影响推理效率吗？

58

1

0

在cgroup限制了CPU资源后物理机级别的load很高，但为什么对运行在其他CPU上的产品影响不大

40

1

0

ModelScope没有看见复制，模型选择、cpu/GPU选择有特别要求吗，有详细说明吗？

42

1

0

ModelScope模型即服务

语音

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

我要提问

热门讨论

热门文章

modelscope上跑报错，提示要pip install ttsfrd，搞不定

关于 Windows平台上 ttsfrd 库的问题。

KeyError: 'asr-inference is not in the pipelines r

linux系统运行TTS语音合成报错 Could not initialize NNPACK

目录空间都删的只剩2G了，还报OSError: [Errno 122] Disk quota exc

ttsfrd 是不开源的吗

PyTorch Transformer 英中翻译超详细教程

No module named 'ttsfrd'

报了很多警告，请问怎么解决？

个性化语音合成训练 [ONNXRuntimeError]:7:INVALID_PROTOBUF

展开全部

KAN-TTS 在 conda 环境下无法安装 ttsfrd

使用开源的模型（像speech_sambert-hifigan_tts_zhida_zh-cn_16k）进行语音合成任务的推理时，推理速度太慢了，500字大约需要1分钟，为什么会这么慢

同一个语音为什么识别结果还不一致的，有大佬知道原因吗（Paraformer语音识别-中文-通用-16k-离线-large-热词版）

kws_util 下载不了

ModelScope官方镜像，CPU环境镜像(python3.8)pull不存在

展开全部

相关课程

更多

云原生AI套件：一键训练大模型及部署GPU共享推理服务

75

1

去学习

相关电子书

更多

阿里巴巴高性能GPU架构与应用 立即下载

GPU在超大规模深度学习中的发展和应用 立即下载

RDS SQL Server CPU高使用率性能优化 立即下载

相关实验场景

更多