讯飞语音

简介: <span style="font-family:宋体">、你需要</span><span>android</span><span style="font-family:宋体">手机应用开发基础</span> <p><span>2</span><span style="font-family:宋体">、科大讯飞语音识别</span><span>SDK android</span><spa
、你需要 android 手机应用开发基础

2、科大讯飞语音识别SDK android

3、科大讯飞语音识别开发API文档

4android手机

关于科大讯飞SDKAPI文档,请到科大语音官网下载:http://open.voicecloud.cn/

当然SDKAPI有多个版本可选,按照你的需要下载,其次,下载需要填写资料申请注册,申请通过或可获得Appid

二、语音识别流程

1、创建识别控件

函数原型

Public RecognizerDialog(Context context,String params)

其中Context表示当前上下文环境,传this即可

Params有参数详见API文档

2、用Appid登录到科大讯飞服务器(自动连接,需要联网)

主要用到SpeechUsercom.iflytek.speech包下)类下的getUser().login()函数

其中getUser()表示获取用户对象,可以实现用户登录,注销等操作

Login函数原型

Public boolean login(Context context,String usr,String pwd,String

参数详见API文档

3、读取语言识别语法

通过abnf文件并读取该文件,实现指定的语言识别语法,比如为了识别并计算国内两个城市之间的距离,abnf文件的内容可以是如下

Abnf文件的读取参考后面的具体开发实例

4、设置识别参数及识别监听器

通过RecognizerDialog下的setEngine()方法设置参数

函数原型

public void setEngine(String engine,String params,String grammar)

详细的参数请参考API文档

5、识别结果回调

需要实现RecognizerDialogListener接口,其中有两个方法需要重写,分别是

1)public void onResults(ArrayList<RecognizerResult> results,boolean isLast)

其中resultRecognizerResult对象的集合,RecognizerResult的属性有

String text 识别文本

Int confidence 识别可信度

2)public void onEnd(SpeechError error)

6、识别结果处理(自行处理)

自己将文本进行处理。

三、详细开发过程

1、新建Android项目

和普通的android项目一样,只是需要加入科大讯飞语言SDK包,主要包括

Msc.jarlibmsc.so动态库文件,项目lib截图

android_voice1.jpg

2、布局

这里只进行简单的布局,只设置一个按钮作为语言识别按钮及一个文本组件用作显示识别结果,布局文件如下

3、识别语法文件

这里只是简答的识别所说的城市名,其中指定了“北京”、“上海”、“广州”、“深圳”、“厦门”

4MainActivity程序

代码如下,请参考上面的语言识别流程

5、给程序相应的权限

由于本程序用到了网络、麦克风等,需要给定一下权限

6、结果截图

android_voice2android_voice3

四、项目文件及android程序下载

项目源文件及android程序安装包

下载地址:http://pan.baidu.com/share/link?shareid=494903&uk=3087605183

本站统一解压密码:www.52wulian.org

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
25天前
|
监控 小程序 JavaScript
快应用-带你实现一个换脸应用
快应用-带你实现一个换脸应用
16 1
快应用-带你实现一个换脸应用
|
12月前
|
人工智能 Serverless 文件存储
还在为证件照发愁?超详细教程帮你轻松打造个人版“妙鸭相机”
正所谓:自己动手,丰衣足食。现在,就教你基于阿里云函数计算FC和文件存储NAS构建个人版“妙鸭相机”。
67884 19
还在为证件照发愁?超详细教程帮你轻松打造个人版“妙鸭相机”
|
Linux Windows
录屏+剪辑神搭档,还找什么camtasia破解版?
相信这些日子大家找破解版找得有点辛苦吧!
455 0
|
人工智能
【必备工具】兔哥视频助手,一键配音、字幕、配图,让你的视频秒变高大上!
通过输入文字,自动生成视频,让你的视频制作更加高效。
1370 0
|
Android开发 iOS开发
视频录制的一些小琐事
视频录制的一些小琐事
|
自然语言处理 开发工具 git
天猫精灵语音开发-第三天
图文详解如何开发天猫精灵语音应用,以及阿里云云开发平台的基本使用,最后将介绍如何把使用阿里云云开发平台做后台开发天猫精灵应用
218 0
|
数据采集 Linux Android开发
智能电视救星,一款堪称良心的视频播放器
之前我给大家介绍一款号称宇宙最强的视频PotPlayer,这款播放器在PC端视频播放器中的确称得上是出类拔萃。
智能电视救星,一款堪称良心的视频播放器
|
JSON 自然语言处理 测试技术
使用科大讯飞语音转文字的服务进行电话录音分析
使用科大讯飞语音转文字的服务进行电话录音分析
使用科大讯飞语音转文字的服务进行电话录音分析
|
机器学习/深度学习 人工智能 自然语言处理
现实版「柯南变声器」来了,搜狗变声让你声音随心变
声音秒变志玲姐姐,秒变「矮大紧」,秒变萝莉、正太,现在通通不是问题!
692 0
现实版「柯南变声器」来了,搜狗变声让你声音随心变
|
文字识别 API Python
共创“拍照翻译(生活服务)
本章采用了阿里云云市场通用文字识别API服务对图片进行文字转换,并采用阿里云云市场通用在线翻译API服务对文字进行翻译,支持的语言包括英文,中文等。
1564 0