modelscope-funasr是否可以得到对应字,或者词的时间戳?
是的,modelscope-funasr能够提供对应字或词的时间戳。特别是,它可以通过参数量较小的encoder与反卷积predictor实现时间戳预测,其时间戳准确率与kaldi force-alignment系统相当。此外,也有集成了VAD、ASR、标点与时间戳功能的Paraformer-large长音频模型,这种模型能够直接对时长为数小时的音频进行识别,并输出带标点文字与时间戳。
是的,modelscope-funasr不仅可以进行语音转文字,还能同时输出对应字或词的时间戳。这通过其时间戳预测功能实现,该功能的准确率与kaldi force-alignment系统相当。另外,对于长音频版本的Paraformer-large模型,它还能够集成VAD(Voice Activity Detection)、ASR(Automatic Speech Recognition)、标点与时间戳功能,这意味着它可以对时长为数小时的音频进行识别,并输出带有标点的文字与时间戳。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352