Android特色开发之语音识别

简介:

本文节选于机械工业出版社推出的《Android应用开发揭秘》一书,作者为杨丰盛。本书内容全面,详细讲解了Android框架、Android组件、用户界面开发、游戏开发、数据存储、多媒体开发和网络开发等基础知识,而且还深入阐述了传感器、语音识别、桌面组件开发、Android游戏引擎设计、Android应用优化、OpenGL等高级知识。另外,本书还全面介绍了如何利用原生的C/C++(NDK)和Python、Lua等脚本语言(Android Scripting Environment)来开发Android应用,并以迭代的方式重现了各种常用的Android应用和经典Android游戏的开发全过程。

9.2  语音识别

语音识别技术在手机上应用得相当广泛,我们日常最频繁的沟通方式是语音,在手机应用中,大部分是通过硬件手动输入,目前这依然是主要与手机互动的方式,然而对于像手机这种小巧的移动设备来说,使用键盘甚至是虚拟键盘打字是一件非常不爽的事情。于是, Google推出了强大的语音搜索业务。2008年11月,Google的语音搜索已经在iPhone平台上线,而Android在1.5 SDK版本中也加强了语音识别功能,并应用到了搜索功能上,这的确是一个非常让人惊喜的更新。我们只需要点击搜索框旁边的那个小话筒形状的按钮,如图9-1所示,Android就可以通过语音识别你要搜索的内容。如果你的语音不够清晰,Android也可以通过大体的意思来提供一些选择,其宗旨是最大限度地改善人机交互的便捷性。相信很快会有更多人性化的功能出现在Android平台上,比如我们在玩游戏时,可以通过语音来控制操作,让我们期待每一次革新带给我们的便捷吧!

图9-1  Android语音识别按钮

Android中主要通过RecognizerIntent来实现语音识别,它主要包括一些常量来表示语音的模式等,如表9-1所示。

表9-1  RecognizerIntent包括的常量

这里我们只需要通过Intent来传递一个动作以及一些属性,然后通过startActivityForResult来开始语音,代码如下:

 
  1. Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);  
  2. intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);  
  3. intent.putExtra(RecognizerIntent.EXTRA_PROMPT,"开始语音");  
  4. startActivityForResult(intent, VOICE_RECOGNITION_REQUEST_CODE); 

 

当然,如果找不到设置,就会抛出异常ActivityNotFoundException,所以我们需要捕捉这个异常。当然,另外需要实现onActivityResult方法,当语音结束时,会触发来获得语音的字符序列。下面我们通过一个例子来学习语音识别(参见本书所附代码:第9章\Examples_09_02),当我们点击“开始使用语音识别”按钮时,开始语音,然后在onActivityResult方法中取得结果并显示出来,运行效果如图9-2所示。由于在模拟器上没有设备,所以显示了ActivityNotFoundException异常,当我们在真机上测试、开始语音时,如图9-3所示,语音结束后取出的字符序列如图9-4所示。

图9-2  ActivityNotFoundException异常  图9-3  开始语音 图9-4  获取的字符序列

该例子很简单,具体实现如代码清单9-2所示。

代码清单9-2  第9章\Examples_09_02\src\com\yarin\android\Examples_09_02\Activity01.java

 
  1. public class Activity01 extends Activity  
  2. {  
  3.  private static final int VOICE_RECOGNITION_REQUEST_CODE = 4321;  
  4.  private ListView mList;  
  5. public void onCreate(Bundle savedInstanceState)  
  6. {  
  7.     super.onCreate(savedInstanceState);  
  8.     setContentView(R.layout.main);  
  9.     mList = (ListView) findViewById(R.id.ListView01);  
  10.     Button button = (Button) findViewById(R.id.Button01);   
  11.     button.setOnClickListener(new View.OnClickListener()   
  12.     {                
  13.         @Override            
  14.         public void onClick(View v)  
  15.         {  
  16.             try 
  17.             {  
  18.                 //通过Intent传递语音识别的模式,开启语音  
  19.                 Intent intent = new Intent  
  20.                 (RecognizerIntent.ACTION_RECOGNIZE_SPEECH);  
  21.                 //语言模式和自由形式的语音识别  
  22.                 intent.putExtra(RecognizerIntent.EXTRA_   
  23.                                 LANGUAGE_MODEL,RecognizerIntent.  
  24.                                 LANGUAGE_MODEL_FREE_FORM);  
  25.  
  26.                 //提示语音开始  
  27.                 intent.putExtra(RecognizerIntent.EXTRA_  
  28.                                 PROMPT,"开始语音");  
  29.                 //开始执行我们的Intent、语音识别  
  30.                 startActivityForResult(intent,   
  31.                 VOICE_RECOGNITION_REQUEST_CODE);  
  32.             }  
  33.             catch (ActivityNotFoundException e)  
  34.             {  
  35.                 //找不到语音设备装置  
  36.                 Toast.makeText(Activity01.this,  
  37.                             "ActivityNotFoundException",   
  38.                             Toast.LENGTH_LONG).show();   
  39.             }  
  40.         }        
  41.     });   
  42. }  
  43. //当语音结束时的回调函数onActivityResult  
  44. @Override 
  45. protected void onActivityResult(int requestCode,int resultCode,Intent data)  
  46. {  
  47.     // 判断是否是我们执行的语音识别  
  48.     if(requestCode==VOICE_RECOGNITION_REQUEST_CODE&&resultCode==RESULT_OK)  
  49.     {  
  50.         // 取得语音的字符  
  51.         ArrayList<String> results = data.getStringArrayListExtra   
  52.         RecognizerIntent.EXTRA_RESULTS);  
  53.         //设置视图更新  
  54.         //mList.setAdapter(new ArrayAdapter<String>(this,android.  
  55.         R.layout.simple_list_item_1,results));  
  56.         String resultsString = "";   
  57.         for (int i = 0; i < results.size(); i++)  
  58.         {  
  59.             resultsString += results.get(i);  
  60.         }   
  61.         Toast.makeText(this,resultsString,Toast.LENGTH_LONG).show();   
  62.         super.onActivityResult(requestCode, resultCode, data);  
  63.     }  
  64. }  






本文转自 yarin 51CTO博客,原文链接: http://blog.51cto.com/yarin/478996 ,如需转载请自行联系原作者
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
3天前
|
Linux 编译器 Android开发
FFmpeg开发笔记(九)Linux交叉编译Android的x265库
在Linux环境下,本文指导如何交叉编译x265的so库以适应Android。首先,需安装cmake和下载android-ndk-r21e。接着,下载x265源码,修改crosscompile.cmake的编译器设置。配置x265源码,使用指定的NDK路径,并在配置界面修改相关选项。随后,修改编译规则,编译并安装x265,调整pc描述文件并更新PKG_CONFIG_PATH。最后,修改FFmpeg配置脚本启用x265支持,编译安装FFmpeg,将生成的so文件导入Android工程,调整gradle配置以确保顺利运行。
24 1
FFmpeg开发笔记(九)Linux交叉编译Android的x265库
|
26天前
|
Java Android开发
Android 开发获取通知栏权限时会出现两个应用图标
Android 开发获取通知栏权限时会出现两个应用图标
12 0
|
1月前
|
XML 缓存 Android开发
Android开发,使用kotlin学习多媒体功能(详细)
Android开发,使用kotlin学习多媒体功能(详细)
102 0
|
1月前
|
设计模式 人工智能 开发工具
安卓应用开发:构建未来移动体验
【2月更文挑战第17天】 随着智能手机的普及和移动互联网技术的不断进步,安卓应用开发已成为一个热门领域。本文将深入探讨安卓平台的应用开发流程、关键技术以及未来发展趋势。通过分析安卓系统的架构、开发工具和框架,本文旨在为开发者提供全面的技术指导,帮助他们构建高效、创新的移动应用,以满足不断变化的市场需求。
18 1
|
1月前
|
机器学习/深度学习 调度 Android开发
安卓应用开发:打造高效通知管理系统
【2月更文挑战第14天】 在移动操作系统中,通知管理是影响用户体验的关键因素之一。本文将探讨如何在安卓平台上构建一个高效的通知管理系统,包括服务、频道和通知的优化策略。我们将讨论最新的安卓开发工具和技术,以及如何通过这些工具提高通知的可见性和用户互动性,同时确保不会对用户造成干扰。
33 1
|
17天前
|
XML 开发工具 Android开发
构建高效的安卓应用:使用Jetpack Compose优化UI开发
【4月更文挑战第7天】 随着Android开发不断进化,开发者面临着提高应用性能与简化UI构建流程的双重挑战。本文将探讨如何使用Jetpack Compose这一现代UI工具包来优化安卓应用的开发流程,并提升用户界面的流畅性与一致性。通过介绍Jetpack Compose的核心概念、与传统方法的区别以及实际集成步骤,我们旨在提供一种高效且可靠的解决方案,以帮助开发者构建响应迅速且用户体验优良的安卓应用。
|
19天前
|
监控 算法 Android开发
安卓应用开发:打造高效启动流程
【4月更文挑战第5天】 在移动应用的世界中,用户的第一印象至关重要。特别是对于安卓应用而言,启动时间是用户体验的关键指标之一。本文将深入探讨如何优化安卓应用的启动流程,从而减少启动时间,提升用户满意度。我们将从分析应用启动流程的各个阶段入手,提出一系列实用的技术策略,包括代码层面的优化、资源加载的管理以及异步初始化等,帮助开发者构建快速响应的安卓应用。
|
19天前
|
Java Android开发
Android开发之使用OpenGL实现翻书动画
本文讲述了如何使用OpenGL实现更平滑、逼真的电子书翻页动画,以解决传统贝塞尔曲线方法存在的卡顿和阴影问题。作者分享了一个改造后的外国代码示例,提供了从前往后和从后往前的翻页效果动图。文章附带了`GlTurnActivity`的Java代码片段,展示如何加载和显示书籍图片。完整工程代码可在作者的GitHub找到:https://github.com/aqi00/note/tree/master/ExmOpenGL。
21 1
Android开发之使用OpenGL实现翻书动画
|
19天前
|
Android开发 开发者
Android开发之OpenGL的画笔工具GL10
这篇文章简述了OpenGL通过GL10进行三维图形绘制,强调颜色取值范围为0.0到1.0,背景和画笔颜色设置方法;介绍了三维坐标系及与之相关的旋转、平移和缩放操作;最后探讨了坐标矩阵变换,包括设置绘图区域、调整镜头参数和改变观测方位。示例代码展示了如何使用这些方法创建简单的三维立方体。
15 1
Android开发之OpenGL的画笔工具GL10
|
26天前
|
Android开发
Android开发小技巧:怎样在 textview 前面加上一个小图标。
Android开发小技巧:怎样在 textview 前面加上一个小图标。
12 0