modelscope-funasr中,请教一下,finetune paraformer模型的时候,32G显存 v100 4500h数据tune的,有没有遇到过这个错误,总是训个几轮就会出错?
一般来说,被kill是资源用超了,例如,内存或者cpu不够了。你先把线程降下去,然后写一个shell脚本,定时统计内存情况,观察一下内存。一般来说,1万小时以上数据,单机8卡,内存需要在256GB以上,当然和卡数也有关系,如果内存只有100GB的话,可以先减少卡数试试。此回答整理自钉群“modelscope-funasr社区交流”