modelscope-funasr的SeACo-Paraformer支持推理时加载热词是吧?推理速度和其它模型上区别大不?
是的,SeACo-Paraformer 支持在推理时加载热词功能。通过加载热词,可以显著提升特定领域或业务场景中关键词的识别准确率。热词功能通过热词列表的形式实现,热词列表是一个以热词文本为Key、热词权重为Value的字典。热词权重的有效取值范围为[1, 5]和[-6, -1],其中:
热词列表最大支持设置500个热词,且对热词文本有以下规则限制: - 纯中文热词不超过10个汉字。 - 纯英文或中英文混合热词按空格分词后,不超过5个词。
关于推理速度,SeACo-Paraformer 的推理速度与其他Paraformer模型(如paraformer-realtime-v2)相比,差异主要取决于以下几个因素: 1. 模型结构优化:SeACo-Paraformer 是基于新一代非自回归端到端模型设计的,具有更快的推理速度和更高的识别精度。相较于早期版本(如paraformer-realtime-v1),其推理效率更高。 2. 热词加载的影响:加载热词会对推理速度产生一定影响,但这种影响通常较小,尤其是在热词数量较少的情况下。如果热词数量较多(接近500个),可能会略微增加推理时间。 3. 采样率与音频格式:SeACo-Paraformer 支持任意采样率的音频输入,而其他模型(如paraformer-realtime-v1)仅支持固定采样率(如16kHz)。因此,在处理不同采样率的音频时,SeACo-Paraformer 的适应性更强,可能表现出更优的推理性能。
综上所述,SeACo-Paraformer 在推理速度上相较于早期模型有明显优势,同时支持热词加载功能,能够满足高精度和高性能的需求。如果您需要进一步优化推理速度,建议根据实际业务需求调整热词数量和权重,并选择适合的模型版本。