蓝牙遥控器智能语音识别方案

简介: 遥控器,语音识别

随着人工智能的发展,语音识别和语义理解技术日益趋近成熟,
达到商用水平。在机顶盒领域,智能语音遥控器已成为标配,实现方
案很多,其中一种讨论如下
ly1.png

一、语音数据(二进制 PCM 流)

应用层 APK:

应用层 APK 程序利用 AudioRecorder 或 MediaRecorder 接口,直
接从安卓系统麦克风处读取,如:

    recorder = new AudioRecord(MediaRecorder.AudioSource.MIC, sampleRate,
            CHANNEL_CONFIG, AUDIO_FORMAT, min);
    SampleRate = 16000;

系统 Rom:

机顶盒系统 Rom 需要集成遥控器厂家提供相应 so 库或蓝牙、语音
方面的标准库文件,底层库上报数据给 AudioFlinger,再转发至
AudioRecorder。
因各家遥控器厂商的 Audio Hal 层 so 库会有些许差异,最好机顶
盒厂商与遥控器厂商联调。

二、语音按键

关于遥控器语音键,较为简单的方式是 Broadcast 广播方案:
系统在安卓 framework 层监听所有按键的 code,如果是语音键,
则发送一个广播出来:

    按下是:net.sunniwell.action.VOICE_KEY_PRESS_DOWN
    抬起是:net.sunniwell.action.VOICE_KEY_PRESS_UP

应用层 apk 通过注册广播接收器 BroadcastReceiver 获取语音键按
下和抬起的动作。
接收广播后,取 intent.getIntExtra("keyCode", 0)这个按键信息,如
果是 142,则确认为蓝牙状态语音按键。

    String action = intent.getAction();
    int code = intent.getIntExtra("keyCode", 0);
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
机器学习/深度学习 数据采集 人工智能
【技术揭秘】高性能粤语语音识别模型构建方案
随着人工智能技术的飞速发展,语音识别(Automatic SpeechRecognition)的应用越来越广泛,对于多语种多口音语音识别的需求也在日渐增加。虽然语音识别系统的基本原理和框架是不受限于语种的,在建立一个新语种的ASR模型时,还是需要结合到语言本身的特点,才能得到较好的效果。
【技术揭秘】高性能粤语语音识别模型构建方案
|
4月前
|
机器学习/深度学习 自然语言处理 机器人
基于深度学习的智能语音机器人交互系统设计方案
**摘要** 本项目旨在设计和实现一套基于深度学习的智能语音机器人交互系统,该系统能够准确识别和理解用户的语音指令,提供快速响应,并注重安全性和用户友好性。系统采用分层架构,包括用户层、应用层、服务层和数据层,涉及语音识别、自然语言处理和语音合成等关键技术。深度学习模型,如RNN和LSTM,用于提升识别准确率,微服务架构和云计算技术确保系统的高效性和可扩展性。系统流程涵盖用户注册、语音数据采集、识别、处理和反馈。预期效果是高识别准确率、高效处理和良好的用户体验。未来计划包括系统性能优化和更多应用场景的探索,目标是打造一个适用于智能家居、医疗健康、教育培训等多个领域的智能语音交互解决方案。
|
6月前
|
前端开发 JavaScript 语音技术
|
6月前
|
机器学习/深度学习 传感器 语音技术
毕业设计|基于STM32单片机的语音识别控制智能停车场设计
毕业设计|基于STM32单片机的语音识别控制智能停车场设计
205 0
|
6月前
|
运维 API 语音技术
Python智能语音识别语翻译平台|项目后端搭建
Python程序设计基础,第三方库Django、requests、hashlib、pyttsx3等的使用,百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。
189 0
Python智能语音识别语翻译平台|项目后端搭建
|
机器学习/深度学习 自然语言处理 算法
构建智能音箱应用:语音识别和自然语言处理
随着人工智能技术的迅猛发展,智能音箱成为了人们生活中的常见智能设备。这些设备可以通过语音指令与用户进行交互,并执行各种任务,如播放音乐、查询天气、控制智能家居等。在幕后,智能音箱背后的核心技术是语音识别和自然语言处理。
557 0
|
机器人 语音技术 开发工具
智能电话机器人,使用Microsoft语音识别技术(Speech sdk)
智能电话机器人,使用Microsoft语音识别技术(Speech sdk)
201 0
智能电话机器人,使用Microsoft语音识别技术(Speech sdk)
|
人工智能 机器人 人机交互
智能电话机器人的语音识别究竟是如何实现的
智能化生活:当你睁开眼睛体味着清晨的第一抹阳光,智能设备就已经在自动工作了,机器人帮你打扫屋子,处理文件,烹饪早餐,走出街道,搭乘AI汽车,进入公司,迎面就是智能前台,在工作中收到的电话或者信息,都有可能实现智能化处理,这些场景在很多年以前是不敢想象的,但在如今已经大部分都得到了实现。 作为人工智能基础研究的语音识别技术,一直都是横亘在研究者面前的难关,而让计算机能够明白人类的语言,实现人机对话已经研究了近30年!从思维模型到具体实现,科学研究者攻克了无数的难关,那么我们今天就来了解一下神秘的语音识别技术吧! 什么是智能语音识别系统?语音识别实际就是将人类说话的内容和意思转化为计算机可读的
|
物联网
《阿里云总监课第二期——IoT时代的语音交互智能》电子版地址
阿里云总监课第二期——IoT时代的语音交互智能