想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？

想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？语音识别服务，实时的

展开

收起

乐天香橙派 2023-07-25 21:17:17 218 版权

3 条回答

写回答

取消提交回答

一颗橙子11111

极速版是吧您也可以自己实现这个的我们支持识别音频文件
我们的sdk是把服务都封装在一起的
—此回答来自钉群“阿里语音AI【6群】”

2023-07-26 10:50:29

赞同展开评论
算精通

北京阿里云ACE会长

初始化SDK,设置好您的AppKey和AccessToken。

打开麦克风,开始录音获取音频数据。

按照音频帧的大小(sdk默认是80ms一帧),每来一帧音频数据就调用一次RecognitionService对象的sendAudio接口来发送这一帧音频。

sendAudio接口的回调函数中,会返回识别结果。

发送识别结果后,继续获取下一帧音频,再次调用sendAudio接口。

上述步骤实际实现了实时语音流识别。您需要做的就是:

打开麦克风,并定期获取音频数据(80ms一帧)
每一帧音频调用sendAudio接口,发送给识别服务
获取sendAudio接口的回调,即获取到实时语音识别结果
循环1~3,实现持续的语音识别
具体API使用如下:

json
Copy
// 初始化配置参数
RSConfig *rsConfig = [[RSConfig alloc] init];
rsConfig.appId = @"你的AppId";
rsConfig.token = @"你的Token";

// 初始化识别服务
RecognitionService *rs = [[RecognitionService alloc] init:rsConfig];

// 当有音频帧时,调用识别服务的sendAudio接口发送
[rs sendAudio:pcmLen pcmBuffer:pcmBuffer pcmSampleRate:sampleRate finish:^(RSResponse _Nullable result, NSError _Nullable error) {
// 获取识别结果
}];

2023-07-26 08:39:26

赞同展开评论
Star时光

问题一：在阿里语音AI的iOS SDK中，可以使用实时音频流进行语音识别服务。您可以将自己的音频流传递给SDK，并通过相应的接口实时进行语音识别。这使您能够实时地将音频数据发送到阿里语音AI服务，以获得实时的语音识别结果。

问题二：是的，在iOS SDK中，您可以直接传递音频流进行语音识别，而无需使用录音接口。通过将音频流传递给相应的接口，您可以实现实时的语音识别功能。这样，您可以根据您的需求和场景，灵活地处理音频数据并获取语音识别的结果。

2023-07-25 21:55:48

赞同展开评论

想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？

相关文章

相关解决方案

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

想咨询下 iOS sdk里面 我在阿里语音AI能传自己的音频流么？

相关文章

相关解决方案

想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？