开发者社区 > ModelScope模型即服务 > 语音 > 正文

Modelscope使用SambertHifigan语音合预训练模型成微调卡住/停住,大佬求救~!!

系统是windows的wsl2 ubuntu20.04
笔记本显卡3060 6G显存 i7 16G内存
cuda 11.6
python 3.7
torch 1.13.1+cu116
torchaudio 0.13.1+cu116
torchvision 0.14.1+cu116

使用该训练模型进行微调
SambertHifigan语音合成-中文-多人预训练-16k
根据教程指示,在微调sambert声学模型时,程序老是在随机某一代卡住,但是从后台监控来看,程序并没有终端,一直保持着高占用的状态,不过内存和显存还有余量。

数据集train 90条 val 10条,共100条,自己录的。

我一开始分析可能是内存不足或者是多线程导致的互锁问题,尝试过修改配置文件config.yaml里的
num_workers: 0 # 4
pin_memory: true # false
以及减小batch_size,都无济于事。

以下是训练卡住时的终端界面和htop内存使用情况:
9dcad2efe89e876e5a083f36ed939d5.png
58eecd1b77a45f7238b1ee90c818997.png
74fb0653ac3196536f949880ca1758d.png

被这个问题折磨2天了,跪求大佬解答,可以有偿。

展开
收起
游客66hghclbj4tea 2023-12-19 17:38:55 255 0
0 条回答
写回答
取消 提交回答

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载