App Inventor 2 语音交互机器人Robot,使用讯飞语音识别引擎

简介: App Inventor 2 语音识别及交互App。识别语言指令并控制机器人运动,主要用到语音识别器及文本朗读器组件,语音识别相关开发最佳入门。代码逻辑简单,App交互性及趣味性非常强~

应用介绍

识别语言指令并控制机器人运动,主要用到语音识别器及文本朗读器组件,语音识别相关开发最佳入门。代码逻辑简单,App交互性及趣味性非常强~
截图.jpg

视频演示

语音Robot教程(难度系数:★★)

教程入口:App Inventor 2 中文网(www.fun123.cn) -> 登陆 -> “项目指南” -> 语音机器人Robot"开始学习"。

语音识别器

语音识别器.png

一般Android手机提供的是Google语音识别引擎,但是经过测试,中文支持不好,经常识别失败,因此这里改用讯飞语音+识别引擎来进行,体验较好,识别率很高。

不过目前版本还稳定维持在1.1.1045,后续几乎不再更新了。

讯飞语音.png

  1. 安装方法:详见教程。

  2. 设置方法:详见教程。

  3. 效果展示:
    中文识别结果.jpg

文本朗读器

文本朗读器.png

文本朗读器这个能不能也使用讯飞语音呢?

经过测试,在“系统设置” — “语言和输入”—“文本转语音” 中将首选引擎设置为讯飞后,朗读出来的内容完全就是杂乱的,不知是不是因为版本过旧,还是其他设置问题,经过一系列尝试(包括设置文本朗读器的国家及语言属性)仍然是不行的。

最终只得选择“Google文字转语言引擎”,设置方法详见教程。

测试代码详见教程。这时,可以对App进行第一阶段的测试,将你的语音识别成文本,输出到屏幕,并朗读出来。

这种交互也是很有趣的,大家有兴趣的话还可以试试将讯飞语音设置为英文、粤语等,这时可以识别出你说的英语及粤语方言~

App基本逻辑设计

基本的交互设计,简单地设计3点如下:

  1. 打招呼指令,可以说“请打个招呼”或“你好”,这时机器人回复说“你好”。
  2. 控制机器人上下左右、斜着移动、回到屏幕中间,若指令不能识别,则说出相应的提示。
  3. 点击机器人提示“别碰我”。

Robot逻辑代码

机器人运动的过程(角度的定义,请右键代码块,查看”帮助“)代码详见教程。

语言识别的逻辑代码详见教程。

点击机器人事件:
点击机器人.png

后记

代码总体非常简单,但是已经具有一定的交互性和可玩性,大家可以自行拓展。

本次课程的关键点在于语音识别引擎的选择,好在直接安装后无需设置就能使用。

文本转语音引擎:一般安卓手机已经默认装好了,但是不排除有些手机没有或者是国外的引擎,这时需要进行一定的设置,建议使用Google引擎,并将语言设置为中文。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
7月前
|
测试技术 UED Python
App自动化测试:高级控件交互技巧
Appium 的 Actions 类支持在移动应用自动化测试中模拟用户手势,如滑动、长按等,增强交互性测试。ActionChains 是 Selenium 的概念,用于网页交互,而 Actions 专注于移动端。在Python中,通过ActionChains和W3C Actions可以定义手势路径,例如在手势解锁场景中,先点击设置,然后定义触点移动路径执行滑动解锁,最后验证解锁后的元素状态。此功能对于确保应用在复杂交互下的稳定性至关重要。
|
4天前
|
移动开发 小程序 PHP
校园圈子论坛系统采取的PHP语音和uni账号开发的小程序APP公众号H5是否只需要4800元?是的,就是只需要4800元
关于校园圈子论坛系统采用PHP语言和uni-app开发的小程序、APP、公众号和H5是否仅需4800元这个问题,实际上很难给出一个确定的答案。这个价格可能受到多种因素的影响
|
1月前
|
监控 安全 开发者
山东布谷科技:关于直播源码|语音源码|一对一直播源码提交App Store的流程及重构经验
分享提交直播源码,一对一直播源码,语音源码到Appstore的重构经验!
|
7月前
|
移动开发 JavaScript 前端开发
如何识别app中的页面是否是js(h5)页面
如何识别app中的页面是否是js(h5)页面
85 2
|
4月前
|
XML Android开发 UED
"掌握安卓开发新境界:深度解析AndroidManifest.xml中的Intent-filter配置,让你的App轻松响应scheme_url,开启无限交互可能!"
【8月更文挑战第2天】在安卓开发中,scheme_url 通过在`AndroidManifest.xml`中配置`Intent-filter`,使应用能响应特定URL启动或执行操作。基本配置下,应用可通过定义特定URL模式的`Intent-filter`响应相应链接。
118 12
|
4月前
|
网络协议 物联网 测试技术
App Inventor 2 MQTT拓展入门(保姆级教程)
本文演示的是App和一个测试客户端进行消息交互的案例,实际应用中,我们的测试客户端可以看着是任意的、支持MQTT协议的硬件,通过订阅及发布消息,联网硬件与我们的App进行双向数据通信,以实现万物互联的智能控制效果。
216 2
|
5月前
|
JSON API 数据格式
App Inventor 2 天气预报App开发 - 第三方API接入的通用方法
通过调用第三方天气api,填入必要的参数,通过Web客户端请求url。返回json格式的数据结果,使用AppInventor2解析json结果,显示到App上即可。
150 5
|
5月前
|
机器学习/深度学习 人工智能 文字识别
文本,文字扫描01,OCR文本识别技术展示,一个安卓App,一个简单的设计,文字识别可以应用于人工智能,机器学习,车牌识别,身份证识别,银行卡识别,PaddleOCR+SpringBoot+Andr
文本,文字扫描01,OCR文本识别技术展示,一个安卓App,一个简单的设计,文字识别可以应用于人工智能,机器学习,车牌识别,身份证识别,银行卡识别,PaddleOCR+SpringBoot+Andr
|
5月前
|
存储 物联网 数据库
App Inventor 2 低功耗蓝牙 BlueToothLE 拓展中文文档(完整翻译加强版)
低功耗蓝牙,也称为蓝牙LE 或简称 BLE,是一种类似于经典蓝牙的新通信协议,不同之处在于它旨在消耗更少的功耗和成本,同时保持同等的功能。 因此,低功耗蓝牙是与耗电资源有限的物联网设备进行通信的首选。
180 0
|
6月前
|
搜索推荐
App Inventor 2 列表排序,函数式编程轻松实现高级排序算法
本文探讨了列表的函数式编程高级用法,允许根据自定义逻辑进行排序。不仅支持基本数据类型(文本和数字)的升序和降序排序,还能处理复杂结构类型中特定元素的排序。通过示例展示了如何定义比较函数来实现升序和降序,简化了排序操作。
68 0