我用基于ModelScope官方镜像CPU环境镜像(python3.7),在本地部署运行。
尝试了mp3可以正常转录,但m4a格式就不行了,在转录过程中出现Killed。
请问Paraformer语音识别-中文-通用-16k-离线-large-长音频版支持的音频格式具体有哪些?
通常被支持:
WAV(Waveform Audio File Format):WAV 是一种无损音频格式,广泛用于存储音频数据。
MP3(MPEG Audio Layer-3):MP3 是一种有损音频格式,常用于音乐和语音的压缩和传输。
FLAC(Free Lossless Audio Codec):FLAC 是一种无损音频格式,提供了较高的音频质量和数据压缩比。
OGG(Ogg Vorbis):OGG 是一种免费、开放和无损的音频格式,常用于音乐和音频流媒体。
这些格式通常被支持,但具体的音频格式支持可能会因部署环境、配置或特定版本而有所不同。在您的具体情况中,如果使用的音频格式不被支持或导致问题,可能需要考虑使用其他格式或进行格式转换,以确保正常的转录过程。