开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr有没有热词支持的分支适配了websocket？

展开

收起

三分钟热度的鱼 2024-01-24 17:36:32 160 版权

阿里云 AI 助理回答

根据提供的参考资料，以下是关于modelscope-funasr是否支持热词功能并适配WebSocket的详细解答：

1. FunASR与热词支持

modelscope-funasr是基于PyTorch的语音处理工具包，主要用于语音识别和合成任务。从现有资料来看，FunASR本身并未明确提及直接支持热词功能的分支。然而，Paraformer作为阿里云语音识别的核心模型之一，明确支持定制热词功能，并且可以通过WebSocket API进行调用。

热词功能说明：
在Paraformer中，热词功能通过vocabulary_id或resource_id参数实现，允许用户在语音识别任务中动态加载热词表，从而提升特定词汇的识别准确率。
热词配置方式：
- vocabulary_id：适用于最新v2系列模型，需在run-task指令中指定热词ID。
- resource_id：适用于v1版本模型，需与resource_type字段同时使用。

2. WebSocket支持情况

Paraformer提供了基于WebSocket的实时语音识别API，支持多种高级功能（如热词、语气词过滤等）。以下为关键点：

WebSocket API支持的功能：
- 热词支持：通过vocabulary_id参数启用热词功能。
- 语气词过滤：通过disfluency_removal_enabled参数开启语气词过滤。
- 多语言支持：通过language_hints参数指定语言代码（如中文、英文、日语等）。
- 语义断句：通过semantic_punctuation_enabled参数控制断句逻辑。
WebSocket消息格式：
- 开启语音识别任务时，需发送run-task指令，并在payload.parameters中配置相关参数（如音频格式、采样率、热词ID等）。
- 示例中的vocabulary_id字段表明热词功能已集成到WebSocket API中。

3. FunASR与WebSocket的适配性

虽然modelscope-funasr本身未明确提及WebSocket支持，但其底层依赖的Paraformer模型已全面支持WebSocket协议，并集成了热词功能。因此，如果需要在FunASR中实现热词支持并通过WebSocket调用，可以考虑以下方案：

方案一：直接使用Paraformer WebSocket API
如果您的应用场景需要热词功能，可以直接调用Paraformer的WebSocket API，而无需额外适配FunASR。
方案二：自定义适配FunASR
如果您希望在FunASR中实现类似功能，可以通过以下步骤：
1. 参考Paraformer的WebSocket API文档，将热词功能集成到FunASR的代码中。
2. 修改FunASR的WebSocket客户端，使其支持vocabulary_id和resource_id参数。