modelscope-funasr实时流模式,对音频pcm的数据要求是什么呢?目前使用单声道,16k,int16,sample大小是640,20ms的输入频率,返回的实时的asr文本text结果是空的。 参数如下:model_asr_streaming = AutoModel(
model="iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online",
model_revision="v2.0.4",
ngpu=args.ngpu,
ncpu=args.ncpu,
device=args.device,
disable_pbar=True,
disable_log=True,
). record_stream: {'message_type': 'record_stream', 'mode': 'online', 'chunk_size': '5,10,5', 'chunk_interval': 10, 'encoder_chunk_look_back': 4, 'decoder_chunk_look_back': 1, 'wav_name': 'microphone', 'is_speaking': True, 'itn': True}
online, {'key': 'rand_key_7In9ZMJLsCfMZ', 'text': ''}
online, {'key': 'rand_key_1qeoePtwBldGD', 'text': ''}
online, {'key': 'rand_key_a4cFut1DdZ04Z', 'text': ''}
online, {'key': 'rand_key_dtl2HUetz1vtA', 'text': ''}