modelscope-funasr是不是没有同时支持输出时间戳和热词的长音频模型呀?
ModelScope-funasr的Paraformer-large长音频模型确实支持输出带标点的文字以及字级别的时间戳。该模型集成了VAD(语音活动检测)、ASR(自动语音识别)、标点与时间戳功能,因此能够直接对时长为数小时的音频进行识别。此外,它还支持基于ModelScope微调定制模型和batch级解码,能加快推理速度。虽然当前并未看到直接支持热词的功能,但这些特性可能会对您的需求有所帮助。同时,它也提供了多种输入音频方式,如wav.scp、音频bytes、音频采样点、WAV格式等。
是的,ModelScope-FunASR的长音频模型确实支持输出时间戳和热词。特别是Paraformer-large长音频模型,它集成了语音端点检测(VAD)、语音识别、标点以及时间戳功能,能够直接对时长为数小时的音频进行识别,并输出带标点的文字以及字级别的时间戳。同时,该模型还具有基于用户的热词列表增强记忆的功能,可以提升模型对热词的召回和精度。因此,对于您的需求,使用Paraformer-large长音频模型应该是一个不错的选择。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352