开发者社区 问答 正文

关键词检测(KWS)是什么?



关键词检测服务介绍


关键词检测服务(KWS)是指用户使用智能语音交互服务时,当在某些场景下需要对一些特定的词语进行针对性识别,用户可以通过自定义关键词及其置信度的方式来达到检测语音中是否包含该关键字的目的。适用于APP音频审核、直播鉴黄等场景。
用户可以通过RESTful API或SDK上传维护关键词词表,然后通过SDK调用KWS服务。

服务原理


词表设置和调用关系及技术原理如下图所示:

上图主要涉及以下四个过程:


  1. 用户首先需要通过提供的restful或sdk 接口进行创建词表

  2. 服务收到创建词表的请求后,会把相应的词存储到数据库中,并返回用户结果(词表id)

  3. 拿到词表id后,调用语音识别sdk并传入词表id及app_key

  4. 服务端收到检测请求时会解析词表id查询数据库,并返回用户检测结果


选择app_key


<table style='background: rgb(255, 255, 255); padding: 0px; outline: 0px; border: 0px currentColor; width: 768px; color: rgb(51, 51, 51); text-transform: none; text-indent: 0px; letter-spacing: normal; overflow: auto; font-family: PingFangSC, "helvetica neue", "hiragino sans gb", arial, "microsoft yahei ui", "microsoft yahei", simsun, sans-serif; font-size: 14px; font-style: normal; font-weight: normal; margin-top: 0px; margin-right: 0px; margin-bottom: 0px !important; margin-left: 0px; word-spacing: 0px; display: table; white-space: normal; border-collapse: collapse; table-layout: fixed; box-sizing: border-box; border-spacing: 0px; orphans: 2; widows: 2; font-variant-ligatures: normal; font-variant-caps: normal; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;' table-condensed?="" table-striped="">[tr][td]app_key[/td][td]语音数据格式[/td][td]领域[/td][/tr][tr][td]nls-service-kws-16k[/td][td]16kHz采样率[/td][td]短视频,视频直播,教育,娱乐,文学,法律,财经等[/td][/tr]

展开
收起
nicenelly 2017-10-25 15:14:49 2699 分享 版权
阿里云 AI 助理回答

阿里云的关键词检测服务(KWS)是一种专为语音数据设计的智能识别功能,它允许用户高效地检测音频流或录音中是否包含预定义的关键词。这项服务对于需要实时监控和过滤特定内容的应用场景尤为重要,比如确保网络直播内容合规、APP中的音频审核等。

服务核心特点:

  1. 自定义关键词:用户可以根据自身需求自定义关键词列表,这些关键词可以是敏感词、指令词或其他具有特定意义的词汇。
  2. 置信度设置:提供置信度阈值设置功能,帮助过滤误报,确保关键词检测的准确性。
  3. RESTful API与SDK支持:用户既可以通过RESTful API方便地管理词表,也可以集成SDK到自己的应用中,实现动态调用关键词检测服务。
  4. 快速响应:服务设计用于低延迟处理,适合实时语音交互和内容监控场景。
  5. 多领域适用:提供了不同领域的app_key,支持多种应用场景,覆盖从短视频、直播到教育、财经等多个行业,满足不同采样率的语音数据格式要求。

技术原理简述:

  • 创建词表:用户通过API或SDK提交关键词列表至云端,系统存储这些关键词并生成一个词表ID。
  • 调用服务:在进行语音识别时,用户需将此词表ID及相应的app_key与语音数据一起通过SDK发送给服务端。
  • 实时检测:服务端接收到请求后,依据词表ID查询数据库中的关键词,对输入的语音数据进行针对性识别,并根据关键词匹配情况返回检测结果,包括是否检测到关键词及其置信度。

app_key选择指导:

选择正确的app_key是使用KWS服务的关键之一,因为它决定了语音数据的处理方式和适用领域。例如,nls-service-kws-16k适用于16kHz采样率的语音数据,广泛应用于短视频、视频直播、教育、娱乐等多种领域。正确选择app_key能确保语音识别的准确性和效率,符合特定场景的需求。

综上所述,阿里云的关键词检测服务为开发者提供了一种灵活且高效的工具,以应对多样化的语音内容监控和分析挑战。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答