modelscope-funasr语音里面有4个字能听出来,但离线识别里面只有3个字,最后一个字会丢,应该怎么解决呀?
我用的命令是:funasr ++model="paraformer-zh" ++input=aaaa.wav
识别的结果是:
[{'key': 'rand_key_2yW4Acq9GFz6Y', 'text': '我 要 打', 'timestamp': [[1830, 2050], [2050, 2270], [2270, 3175]]}]
原语音里面是:“我要打卡”
丢了最后一个字