语音服务适配指南

简介: 本文介绍 语音服务适配指南

1. 概述

语音服务组件提供关键词识别和语音数据的处理控制。输入麦克风的语音数据经过回音消除降噪和关键词识别处理后再输出到应用层使用。YoC在语音服务接口和算法实现之间增加了适配层,方便多种语音算法的接入,保持了应用代码的统一。

下图以SC5654芯片双核架构为例,适配层利用核间通讯,实现应用与DSP算法的数据交互。

image.png

2. 适配接口

2.1 语音服务适配接口

语音服务适配接口注册在mic_ops结构体中,详细信息如下:

组件:mic

头文件:

语音服务的适配接口如下:

image.png

2.2 应用接口映射

应用通过调用应用层API,操作对应语音服务适配接口,语音服务开发者只需实现适配接口定义。用户无需修改代码,即可迁移至对应语音服务上。

应用API与语音服务适配接口映射如下:

image.png

3. 接口说明

2.2 init

函数原型

int (*init) (mic_t *mic, mic_event_t mic_event);

功能描述

语音服务初始化,在应用调用aui_mic_start时会调用该接口。若有私有数据需要保存,可通过函数mic_set_privdata将其保存在mic->priv私有成员指针中。设置后,其他适配函数就可以通过函数mic_get_privdata获取该指针。语音服务层通过应用注册的mic_event回调函数将语音事件传递给应用层。

参数描述

image.png

相关定义

image.png

返回值

image.png

2.3 deinit

函数原型

int (*deinit) (mic_t *mic);

功能描述

应用接口aui_mic_stop执行时会调用该适配接口释放资源。

参数描述

image.png

2.3 kws_control

函数原型

int (*kws_control) (mic_t *mic, int flag);

功能描述

关键词识别使能控制。

参数描述

image.png

2.4 kws_wake

函数原型

int (*kws_wake) (mic_t *mic, int flag);

功能描述

强制算法发出一个模拟唤醒事件。

参数描述

image.png

2.5 pcm_data_control

函数原型

int (*pcm_data_control) (mic_t *mic, int flag);

功能描述

控制算法输出的音频流的开关。

参数描述

image.png

2.6 pcm_aec_control

函数原型

int (*pcm_aec_control) (mic_t *mic, int flag);

功能描述

控制算法是否使能回音消除。

参数描述

image.png

2.7 pcm_set_param

函数原型

int (*pcm_set_param) (mic_t *mic, void *param);

功能描述

初始化语音算法参数。

参数描述

image.png

返回值

image.png

2.8 mic_set_privdata

函数原型

int mic_set_privdata(void *priv);

功能描述

设置适配私有数据到mic对象。

参数描述

image.png

2.9 mic_get_privdata

函数原型

void *mic_get_privdata(void);

功能描述

获取mic对象中的私有数据指针。

参数描述

返回值

image.png

2.10 mic_ops_register

函数原型

int mic_ops_register(mic_ops_t *ops);

功能描述

注册适配层,一般增加一个适配需要实现一个新的函数封装该函数,提供一个简单的注册函数供应用使用。

参数描述

image.png

3 适配示例

适配完成所有接口函数后,定义适配接口结构体,完成函数注册。

示例如下:

/* 适配接口结构体 */
static mic_ops_t mic_adp_ops = {
    .init = mic_adaptor_init,
    .deinit = mic_adaptor_deinit,
    .kws_control = mic_adaptor_kws_control,
    .kws_wake = mic_adaptor_kws_wake,
    .pcm_data_control = mic_adaptor_pcm_data_control,
    .pcm_aec_control = mic_adaptor_pcm_aec_control,
    .pcm_set_param = mic_adaptor_set_param,
    .pcm_get_param = mic_adaptor_get_param,
};

/* 注册函数 */
void mic_thead_v1_register(void)
{
    mic_ops_register(&mic_adp_ops);
}

文章来源:芯片开放社区
文章链接:https://occ.t-head.cn/community/post/detail?spm=a2cl5.14300636.0.0.1b87180flWxVN5&id=3772275121524969472

相关文章
使用阿里云语音通知http批量推送模式获取用户回执短信内容
本文使用阿里云语音通知配置http批量推送模式获取用户回执信息,并进行测试
1032 0
|
安全 JavaScript 机器人
阿里云 语音服务-国内语音服务
阿里云 语音服务-国内语音服务
1060 0
阿里云 语音服务-国内语音服务
|
云计算
阿里云产品体系分为6大分类——云计算基础——云通信——语音服务
阿里云产品体系分为6大分类——云计算基础——云通信——语音服务自制脑图
242 0
阿里云产品体系分为6大分类——云计算基础——云通信——语音服务
《阿里云产品手册2022-2023 版》——语音服务
《阿里云产品手册2022-2023 版》——语音服务
252 0
|
云计算
秒懂云通信:如何用阿里云语音通知服务(小白指南)
手把手教你如何使用阿里云语音通知服务,超详细控制台步骤解析,快速上手!更有1650元短信体验代金券和免费试用,点击速抢:https://yqh.aliyun.com/live/cloudcommunication-videos
4507 0
秒懂云通信:如何用阿里云语音通知服务(小白指南)
|
3月前
|
人工智能 Linux API
【最全】OpenClaw保姆级部署步骤(阿里云/Win11/MacOS/Linux)+必装SKill清单+FAQ,让AI成为全能助手!
“OpenClaw只是个框架,真正让它变强的是Skills”——这是无数用户的实战心得。2026年ClawHub技能市场持续扩容,但多数用户仍面临“选技能难、用技能乱”的困境:要么找不到适配场景的工具,要么安装后不知如何发挥价值。参考文章作者从数据分析、文件管理、视频处理等核心场景出发,精选出一批高实用度技能,用真实案例验证了“装对技能=效率翻倍”的核心逻辑。
747 5
|
Arthas 测试技术
Arthas排查生产环境CPU飚高问题
Arthas排查生产环境CPU飚高问题
460 0
Arthas排查生产环境CPU飚高问题
|
2月前
|
存储 人工智能 监控
Coze 智能体开发标准流程
在Coze平台开发AI智能体分四步:创建(手动或AI生成)、编排(人设/插件/工作流/知识库)、调试(多轮测试+节点监控)、发布(多渠道+API)。国内版用豆包模型,国际版支持GPT-4o/Claude。结构化Prompt与工作流是提效关键。(239字)
|
Java 关系型数据库 MySQL
基于SpringBoot+Vue企业oa管理系统(源码+部署说明+演示视频+源码介绍)(1)
基于SpringBoot+Vue企业oa管理系统(源码+部署说明+演示视频+源码介绍)
550 0