语音服务适配指南

简介: 本文介绍 语音服务适配指南

1. 概述

语音服务组件提供关键词识别和语音数据的处理控制。输入麦克风的语音数据经过回音消除降噪和关键词识别处理后再输出到应用层使用。YoC在语音服务接口和算法实现之间增加了适配层,方便多种语音算法的接入,保持了应用代码的统一。

下图以SC5654芯片双核架构为例,适配层利用核间通讯,实现应用与DSP算法的数据交互。

image.png

2. 适配接口

2.1 语音服务适配接口

语音服务适配接口注册在mic_ops结构体中,详细信息如下:

组件:mic

头文件:

语音服务的适配接口如下:

image.png

2.2 应用接口映射

应用通过调用应用层API,操作对应语音服务适配接口,语音服务开发者只需实现适配接口定义。用户无需修改代码,即可迁移至对应语音服务上。

应用API与语音服务适配接口映射如下:

image.png

3. 接口说明

2.2 init

函数原型

int (*init) (mic_t *mic, mic_event_t mic_event);

功能描述

语音服务初始化,在应用调用aui_mic_start时会调用该接口。若有私有数据需要保存,可通过函数mic_set_privdata将其保存在mic->priv私有成员指针中。设置后,其他适配函数就可以通过函数mic_get_privdata获取该指针。语音服务层通过应用注册的mic_event回调函数将语音事件传递给应用层。

参数描述

image.png

相关定义

image.png

返回值

image.png

2.3 deinit

函数原型

int (*deinit) (mic_t *mic);

功能描述

应用接口aui_mic_stop执行时会调用该适配接口释放资源。

参数描述

image.png

2.3 kws_control

函数原型

int (*kws_control) (mic_t *mic, int flag);

功能描述

关键词识别使能控制。

参数描述

image.png

2.4 kws_wake

函数原型

int (*kws_wake) (mic_t *mic, int flag);

功能描述

强制算法发出一个模拟唤醒事件。

参数描述

image.png

2.5 pcm_data_control

函数原型

int (*pcm_data_control) (mic_t *mic, int flag);

功能描述

控制算法输出的音频流的开关。

参数描述

image.png

2.6 pcm_aec_control

函数原型

int (*pcm_aec_control) (mic_t *mic, int flag);

功能描述

控制算法是否使能回音消除。

参数描述

image.png

2.7 pcm_set_param

函数原型

int (*pcm_set_param) (mic_t *mic, void *param);

功能描述

初始化语音算法参数。

参数描述

image.png

返回值

image.png

2.8 mic_set_privdata

函数原型

int mic_set_privdata(void *priv);

功能描述

设置适配私有数据到mic对象。

参数描述

image.png

2.9 mic_get_privdata

函数原型

void *mic_get_privdata(void);

功能描述

获取mic对象中的私有数据指针。

参数描述

返回值

image.png

2.10 mic_ops_register

函数原型

int mic_ops_register(mic_ops_t *ops);

功能描述

注册适配层,一般增加一个适配需要实现一个新的函数封装该函数,提供一个简单的注册函数供应用使用。

参数描述

image.png

3 适配示例

适配完成所有接口函数后,定义适配接口结构体,完成函数注册。

示例如下:

/* 适配接口结构体 */
static mic_ops_t mic_adp_ops = {
    .init = mic_adaptor_init,
    .deinit = mic_adaptor_deinit,
    .kws_control = mic_adaptor_kws_control,
    .kws_wake = mic_adaptor_kws_wake,
    .pcm_data_control = mic_adaptor_pcm_data_control,
    .pcm_aec_control = mic_adaptor_pcm_aec_control,
    .pcm_set_param = mic_adaptor_set_param,
    .pcm_get_param = mic_adaptor_get_param,
};

/* 注册函数 */
void mic_thead_v1_register(void)
{
    mic_ops_register(&mic_adp_ops);
}

文章来源:芯片开放社区
文章链接:https://occ.t-head.cn/community/post/detail?spm=a2cl5.14300636.0.0.1b87180flWxVN5&id=3772275121524969472

相关文章
使用阿里云语音通知http批量推送模式获取用户回执短信内容
本文使用阿里云语音通知配置http批量推送模式获取用户回执信息,并进行测试
885 0
|
安全 JavaScript 机器人
阿里云 语音服务-国内语音服务
阿里云 语音服务-国内语音服务
939 0
阿里云 语音服务-国内语音服务
|
云计算
阿里云产品体系分为6大分类——云计算基础——云通信——语音服务
阿里云产品体系分为6大分类——云计算基础——云通信——语音服务自制脑图
202 0
阿里云产品体系分为6大分类——云计算基础——云通信——语音服务
《阿里云产品手册2022-2023 版》——语音服务
《阿里云产品手册2022-2023 版》——语音服务
197 0
|
云计算
秒懂云通信:如何用阿里云语音通知服务(小白指南)
手把手教你如何使用阿里云语音通知服务,超详细控制台步骤解析,快速上手!更有1650元短信体验代金券和免费试用,点击速抢:https://yqh.aliyun.com/live/cloudcommunication-videos
4285 0
秒懂云通信:如何用阿里云语音通知服务(小白指南)
|
Arthas 测试技术
Arthas排查生产环境CPU飚高问题
Arthas排查生产环境CPU飚高问题
392 0
Arthas排查生产环境CPU飚高问题
|
存储 缓存 安全
企业出海合规:如何区分数据控制者与数据处理者
数据控制者是确定个人数据处理目的和方式的实体,负有最大责任,需保护数据主体的隐私。数据处理者是按照控制者指示处理个人数据的实体,负责数据安全和协助控制者履行职责。两者需通过明确的合同规定责任。数据控制者的职责包括确定目的、获得同意、确保安全、提供透明度、促进权利行使、进行DPIA和建立协议。数据处理者负责按指示处理数据、确保安全和保密、协助控制者、处理数据泄露通知、数据删除和遵守法律。
1283 0
|
存储 算法 Java
深入解析 Java 数据结构:红黑树的特点与应用
红黑树(Red-Black Tree)是一种自平衡的二叉搜索树,它在 Java 编程中扮演着重要的角色,用于高效地存储和管理数据。红黑树的特点使其在查找、插入和删除操作中保持相对平衡,从而提供了稳定且高效的性能。本文将深入探讨红黑树的特点、用法、实现方式以及在实际应用中的优势。
|
存储 人工智能 数据安全/隐私保护
开启智能新时代:2024年中国AI大模型产业发展报告
【4月更文挑战第6天】2024年,中国AI大模型产业蓬勃发展,成为科技和经济增长新引擎。人民网财经研究院与至顶科技联合发布报告,详述产业发展背景、现状、挑战与趋势。政策支持下,AI大模型技术进步显著,在办公、制造等领域广泛应用。报告提及云侧与端侧大模型,以及科大讯飞、百度、阿里巴巴等企业的大模型案例。挑战包括算力瓶颈、资源消耗及训练数据不足。未来趋势包括云侧与端侧模型的分化、通用与专用模型并存、大模型开源及芯片技术升级。
899 3
开启智能新时代:2024年中国AI大模型产业发展报告
|
存储 缓存 测试技术
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
近日,在 ClickHouse 发起的分析型数据库性能测试排行榜 ClickBench(https://benchmark.clickhouse.com/)中,现代化实时数仓 SelectDB 时隔两年后再次登顶,在全部近百款数据库和数十种机型中,性能表现位居总榜第一!
675 1