开发者社区 问答 正文

关键词检测(KWS)是什么?



关键词检测服务介绍


关键词检测服务(KWS)是指用户使用智能语音交互服务时,当在某些场景下需要对一些特定的词语进行针对性识别,用户可以通过自定义关键词及其置信度的方式来达到检测语音中是否包含该关键字的目的。适用于APP音频审核、直播鉴黄等场景。
用户可以通过RESTful API或SDK上传维护关键词词表,然后通过SDK调用KWS服务。

服务原理


词表设置和调用关系及技术原理如下图所示:

上图主要涉及以下四个过程:


  1. 用户首先需要通过提供的restful或sdk 接口进行创建词表

  2. 服务收到创建词表的请求后,会把相应的词存储到数据库中,并返回用户结果(词表id)

  3. 拿到词表id后,调用语音识别sdk并传入词表id及app_key

  4. 服务端收到检测请求时会解析词表id查询数据库,并返回用户检测结果


选择app_key

app_key语音数据格式领域
nls-service-kws-16k16kHz采样率短视频,视频直播,教育,娱乐,文学,法律,财经等

展开
收起
nicenelly 2017-11-01 10:24:24 9155 分享 版权
阿里云 AI 助理回答

阿里云的关键词检测服务(KWS)是一种智能语音技术,专为需要识别特定词汇或短语的场景设计。这项服务允许用户自定义关键词列表,并设置相应的置信度阈值,以便在接收到的语音数据中高效地检测这些关键词的存在。这对于内容审核、敏感信息过滤、指令触发等应用场景尤为有用,比如APP中的音频内容审核、直播平台的违规内容监测等。

服务核心特点:

  1. 自定义关键词:用户可以根据需求添加任意关键词到词表中,灵活性高,适应多种业务场景。
  2. 置信度调整:支持对每个关键词设置置信度阈值,以优化识别准确率,减少误报和漏报。
  3. RESTful API与SDK集成:提供便捷的API接口和SDK工具包,便于开发者快速集成到自己的应用中。
  4. 实时性:适用于实时语音流的处理,如直播鉴黄、即时通讯中的敏感词过滤等。
  5. 多领域适用:支持不同领域的应用,包括但不限于短视频、视频直播、教育、娱乐、文学、法律、财经等,覆盖广泛。

技术原理简述:

  • 创建词表:用户通过RESTful API或SDK上传关键词列表至阿里云服务器,系统会生成一个词表ID作为后续调用的标识。
  • 词表存储:服务端接收关键词后,将其存储于数据库中,确保关键词检测时能快速访问。
  • 语音检测调用:在进行语音识别时,应用程序通过SDK调用KWS服务,并传入之前获得的词表ID及认证信息(如app_key),指示服务使用特定词表进行检测。
  • 结果返回:服务根据传入的语音数据,匹配词表中的关键词,计算置信度,并将是否命中关键词及其置信度等结果返回给用户。

app_key选择与语音数据格式:

  • app_key是接入阿里云服务的身份验证密钥,确保请求的安全性和合法性。每个项目或应用应有独立的app_key。
  • 语音数据格式:提到的“nls-service-kws-16k16kHz采样率”指适合KWS服务的语音数据应采用16kHz的采样率,这是为了保证语音识别的清晰度和准确性,适用于大多数实时交互和流媒体场景。

综上所述,阿里云关键词检测服务(KWS)以其高度定制化、实时响应能力和广泛的行业适用性,为开发者提供了强大的语音关键词识别解决方案。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答