STM32工程---非特定语音识别模块使用---语音播报+语音识别

简介: STM32工程---非特定语音识别模块使用---语音播报+语音识别

买了2种语音模块,一个龙邱SYN7318,一个讯飞的离线语音模块,今天先记录下移植SYN7318,讯飞的还没搞

这个是已经移植到正点原子F1开发板的程序,下载地址:https://download.csdn.net/download/weixin_42445727/10749169

一、买到模块之后找客服要资料,说真的,每次用个新的模块,都是一堆资料,其实我感觉很多都没必要看,今天记录下这个,就是可以让第一次用的人可以节省时间,快速上手这个模块

二、模块的词条烧录

通过USB转TTL与模块相连,只需要连接模块的TX、RX、VCC、GND即可烧录

1、打开这个软件,

2、修改资源中文本文件,将其改成自己要识别的词条,这里我将【03词典-用户1】改成这样,跟我上传的程序对应

3、可以用这个软件简单的测试一下识别效果。点击【开始识别】按钮,说出文本文件中的词条,在软件中可以看到识别结果

4、点击【词条更新】按钮,即可将自己设置的词条烧录到模块中。

三、将模块连接到单片机进行实验

1、模块与单片机的硬件连接

其实上面很多引脚留出来都没什么作用,当然也可能我自己没用到。

2、将我上传的程序,烧录到原子的开发板中,说出相应的词条就可以看到LED有相应的效果。

关于程序识别语音和实现语音播报,在程序中有详细的注释。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
7月前
【STM32】NRF24L01模块的收发调试(三)
【STM32】NRF24L01模块的收发调试
252 0
|
7月前
【STM32】NRF24L01模块的收发调试(二)
【STM32】NRF24L01模块的收发调试
151 0
|
14天前
|
人工智能 自然语言处理 语音技术
Ultravox:端到端多模态大模型,能直接理解文本和语音内容,无需依赖语音识别
Ultravox是一款端到端的多模态大模型,能够直接理解文本和人类语音,无需依赖单独的语音识别阶段。该模型通过多模态投影器技术将音频数据转换为高维空间表示,显著提高了处理速度和响应时间。Ultravox具备实时语音理解、多模态交互、低成本部署等主要功能,适用于智能客服、虚拟助手、语言学习等多个应用场景。
75 14
Ultravox:端到端多模态大模型,能直接理解文本和语音内容,无需依赖语音识别
|
3月前
|
Ubuntu 机器人 语音技术
语音识别与语音控制的原理介绍
硬件平台 机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版 运行案例 首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。 cd /userdata/dev_ws/ # 配置TogetheROS环境 source /opt/tros/setup.bash # 从tros.b的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载音频驱动,设备启动之后只
262 83
|
2月前
|
Ubuntu 机器人 语音技术
语音识别与语音控制
【10月更文挑战第4天】硬件平台 机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版 运行案例 首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。 cd /userdata/dev_ws/ # 配置TogetheROS环境 source /opt/tros/setup.bash # 从tros.b的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载
|
2月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
51 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
5月前
|
达摩院 语音技术 异构计算
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
语音识别-免费开源的语音转文本软件Whisper的本地搭建详细教程,python版本是3.805,ffmpeg是专门处理音视频的,ffmpeg的下载链接,现在要求安装python和ffmpeg
|
5月前
|
机器学习/深度学习 自然语言处理 搜索推荐
通义语音大模型评测:迈向更自然、更智能的语音交互
随着人工智能技术的迅猛发展,语音识别和自然语言处理领域不断涌现出新的模型和应用。阿里云推出的通义语音大模型,正是在这一背景下应运而生。本文将对通义语音大模型进行详细评测,探讨其技术架构、应用场景、性能表现以及未来发展前景。
449 0
|
5月前
|
机器学习/深度学习 人工智能 API
在人工智能和机器学习的领域中,语音识别(Speech Recognition,SR)是一个重要的研究方向。它旨在将人类的语音转换为计算机可读的文本。
在人工智能和机器学习的领域中,语音识别(Speech Recognition,SR)是一个重要的研究方向。它旨在将人类的语音转换为计算机可读的文本。