智能语音交互--声音事件检测Quick Start-阿里云开发者社区

智能语音交互--声音事件检测Quick Start

2022-08-30 955 发布于浙江

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 智能语音交互（Intelligent Speech Interaction）是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲字幕等场景，在金融、司法、电商等多个领域均有应用。在新增的语音分析产品中声音事件检测可通过一段声音来对环境音（包括语音、短视频等）里面的事件类型进行检测分类，其主要任务是检测识别音频中诸如背景音乐、哭声、笑声、爆炸声之类的声音，并标注出声音的起止时间，适用于家庭安全监护、音视频剪辑等。本文将使用Java SDK演示声音事件检测服务的调用以供参考。

使用前提与环境准备：服务开通并购买

操作步骤：

1.添加pom依赖

<dependency>
    <groupId>com.alibaba.nls</groupId>
    <artifactId>nls-sdk-recognizer</artifactId>
    <version>2.2.1</version>
</dependency>
<dependency>
  <groupId>com.alibaba.nls</groupId>
  <artifactId>nls-sdk-common</artifactId>
  <version>2.2.1</version>
</dependency>
<dependency>
  <groupId>com.alibaba.nls</groupId>
  <artifactId>nls-sdk-request</artifactId>
  <version>2.2.1</version>
</dependency>
        
          
        
        
        
          
          AI 代码解读

2.Code Sample

import com.alibaba.nls.client.protocol.NlsClient;
import com.alibaba.nls.client.protocol.commonrequest.CommonRequest;
import com.alibaba.nls.client.protocol.commonrequest.CommonRequestListener;
import com.alibaba.nls.client.protocol.commonrequest.CommonRequestResponse;
import java.io.InputStream;
import java.util.Arrays;
//声音事件检测
public class AudioEventDetectionDemo {

    public static final String TOKEN = "XXXXXXXXXX";

    public static final String APPKEY = "XXXXXXXXXX";

    private static final String NAMESPACE = "AudioEventDetection";

    private static final String URL = "wss://nls-gateway.cn-shanghai.aliyuncs.com/ws/v1";

    private static final int SAMPLE_RATE = 16000;

    private static final int CHUNK_DURATION = 200;

    public static void main(String[] args) throws Exception {
        NlsClient client = new NlsClient(URL, TOKEN);

        //InputStream stream = AudioEventDetectionDemo.class.getResourceAsStream("/test.pcm");
        FileInputStream stream = new FileInputStream("D:\\download\\test.pcm");

        CommonRequestListener listener = getListener();
        CommonRequest request = new CommonRequest(client, listener, NAMESPACE);
        request.setAppKey(APPKEY);
        request.addCustomedParam("format", "pcm");
        request.addCustomedParam("sample_rate", 16000);
        request.start();
        int chunkSize = SAMPLE_RATE * 2 / 1000 * CHUNK_DURATION;
        byte[] data = new byte[chunkSize];
        while (true) {
            int len = stream.read(data);
            if (len < 0) {
                break;
            }
            if (len > 0) {
                request.send(Arrays.copyOf(data, len));
            }
            Thread.sleep(CHUNK_DURATION / 10);
        }
        request.stop();

        client.shutdown();
    }

    private static CommonRequestListener getListener() {
        CommonRequestListener listener = new CommonRequestListener() {
            @Override
            public void onStarted(CommonRequestResponse response) {
                System.out.println(
                        "onStarted, taskId: " + response.getTaskId() + ", header: " + response.header + ", payload: "
                                + response.payload);
            }

            @Override
            public void onEvent(CommonRequestResponse response) {
                System.out.println(
                        "onEvent, taskId: " + response.getTaskId() + ", header: " + response.header + ", payload: "
                                + response.payload);
            }

            @Override
            public void onStopped(CommonRequestResponse response) {
                System.out.println(
                        "onStopped, taskId: " + response.getTaskId() + ", header: " + response.header + ", payload: "
                                + response.payload);
            }

            @Override
            public void onFailed(CommonRequestResponse response) {
                System.out.println(
                        "onFailed, taskId: " + response.getTaskId() + ", header: " + response.header + ", payload: "
                                + response.payload);
            }
        };
        return listener;
    }
}
        
          
        
        
        
          
          AI 代码解读

3.测试结果

onFailed, taskId: f0d669851a1a40e8804d1e11651b756c, header: {namespace=Default, name=TaskFailed, message_id=80455ce2482748b1b85260a4634f5c93, task_id=f0d669851a1a40e8804d1e11651b756c, status_text=Gateway:FREE_TRIAL_EXPIRED:The free trial has expired!, status=40000010}, payload: {}
        
          
        
        
        
          
          AI 代码解读

目前由于语音分析服务并不支持免费试用版，需要控制台开通商用版才可正常试用

4.升级商用后再次测试结果


onEvent, taskId: f06635cda4624969850a314ab99fc6db, header: {namespace=AudioEventDetection, name=TaskResult, message_id=de21af540281426e8c6cd573fb92c15e, task_id=f06635cda4624969850a314ab99fc6db, status_text=Gateway:SUCCESS:Success., status=20000000}, payload: {result=[{"start_time":0,"event_type":"Music","confidence":0.8432333469390869,"end_time":1970}], number=1}
        
          
        
        
        
          
          AI 代码解读

智能语音交互--声音事件检测Quick Start

使用前提与环境准备：服务开通并购买

操作步骤：

1.添加pom依赖

2.Code Sample

3.测试结果

4.升级商用后再次测试结果

更多参考

云服务技术课堂

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互--声音事件检测Quick Start

使用前提与环境准备：服务开通并购买

操作步骤：

1.添加pom依赖

2.Code Sample

3.测试结果

4.升级商用后再次测试结果

更多参考

云服务技术课堂

热门文章

最新文章

相关课程

相关电子书