您好,在论文《FRCRN: BOOSTING FEATURE REPRESENTATION USING FREQUENCY RECURRENCE FOR MONAURAL SPEECH ENHANCEMENT》的3.2节中提到对全频段48KHZ语音增强时,窗长是20ms,帧移是10ms,STFT长度增加到1920,得到了长度为1921的频带。请问为什么得到的频带长度为1921呢?不应该是1920//2+1=961吗? 如有答复不胜感谢!
编解码器中各有6个CR模块,时序建模中有两个CFSMN。帧长20ms帧移10ms,STFT点数为1920,按1-641,641-1282,1282-1921的频点索引将整个STFT谱分为三组并沿通道为拼接,即网络输入通道数为3。网络输出的cIRM为对于为1921。