modelscope-funasr有能够同时支持热词、时间戳的模型吗?
在ModelScope和FunASR中,确实存在支持热词功能的模型,但关于是否同时支持热词和时间戳的功能,需要结合具体模型的能力进行分析。
根据知识库中的描述,Paraformer系列模型支持热词功能。热词通过热词列表的形式在SDK中使用,热词列表是一个以热词文本为Key、热词权重为Value的字典。热词的具体规则包括: - 热词文本规则:纯中文热词不超过10个汉字;纯英文或中英文混合热词按空格分词后不超过5个词。 - 热词权重范围:有效取值为[1, 5](提高识别概率)或[-6, -1](降低识别概率)。
Paraformer系列模型中支持热词功能的包括以下几种: - paraformer-realtime-v1
:适用于16kHz采样率的实时语音识别场景。 - paraformer-v1
:适用于16kHz及以上采样率的中英文语音识别。 - paraformer-mtl-v1
:多语言模型,支持多种语种和方言。
Paraformer系列模型本身支持时间戳功能,能够在语音转文字的过程中输出每个词语的时间信息。这意味着,用户可以在调用模型时获取到语音中每个词语的起始时间和结束时间。
结合上述两点,Paraformer系列模型(如paraformer-v1
和paraformer-mtl-v1
)能够同时支持热词和时间戳功能。在实际使用中,您可以通过以下方式实现: - 热词配置:在调用模型时,通过SDK中的AsrPhraseManager
类管理热词的创建、更新、删除和查询等功能。 - 时间戳输出:在模型的输出结果中,默认会包含每个词语的时间戳信息。
如果您计划使用ModelScope-FunASR中的相关功能,可以按照以下步骤安装和验证FunClip工具包: 1. 克隆代码仓库:
git clone https://github.com/alibaba-damo-academy/FunASR.git
cd FunASR
pip install -r requirements.txt
pip install funasr[clip]
python -c "import funasr.utils.cli_utils; funasr.utils.cli_utils.print_info()"
paraformer-realtime-v1
,而多语言场景则推荐使用paraformer-mtl-v1
。综上所述,Paraformer系列模型(如paraformer-v1
和paraformer-mtl-v1
)能够同时支持热词和时间戳功能,并且可以通过ModelScope-FunASR工具包进行部署和调用。如果您有进一步的需求或疑问,可以参考相关文档或联系技术支持团队获取帮助。