Freesiwtch VAD语音识别模块参数-开发电话智能语音机器人

简介: Freesiwtch VAD语音识别模块参数-开发电话智能语音机器人

Freesiwtch VAD语音识别模块参数-开发电话语音机器人
1、高性能商业VAD静音检测模块、噪音过滤、自动增益模块
2、无损不压缩采集方式,识别效率全国最高
3、异步说话、多句话, 整句话事件
4、最小说话时间、最大说话时间、最小停顿时间、最大停顿时间

ast_start_asr 说明
ast_start_asr 是一个异步函数, 说话完成自动停止 ,也可以调用ast_sotp_asr 结束识别

ast_start_asr [] [] [] [] []

configure_name asr配置文件名。可以不同呼叫使用不同的ASR配置。
min_speak_ms 最小说话时间,默认值200,单位毫秒,说话时间小于这个值,会被认为是空音。
max_speak_ms 最大说话时间,默认值10000,单位毫秒,说话时间超过这个值,就停止录音,提交ASR服务器识别。
min_pause_ms 最小停顿时间,默认值300,单位毫秒,默认值用户停顿时间超过这个值,多句话中的一句话完成,发送 ast_asrprogress事件
max_pause_ms 最大停顿时间,默认值600,单位毫秒,用户停顿时间超过这个值,认为一句话说完,所有识别完成后发送ast_asrmessage事件
ast_stop_asr
停止ASR。

Feeswtich 订阅 事件
CUSTOM ast_asrprogress ast_asrmessage

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: ast_asrprogress
Event-Name: CUSTOM
asrtext_sub: 第一句话。;
asrelapse: 394
recordindex:1
Unique-ID: fe51e722-7210-4f3a-b3a0-fe605344cf52
recordfile=c:/rec/fe51e722-7210-4f3a-b3a0-fe605344cf52_1.wav

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: ast_asrprogress
Event-Name: CUSTOM
asrtext_sub: 第二句话。;
asrelapse: 340
recordindex:2
Unique-ID: fe51e722-7210-4f3a-b3a0-fe605344cf52
recordfile=c:/rec/fe51e722-7210-4f3a-b3a0-fe605344cf52_2.wav

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: ast_asrmessage
Event-Name: CUSTOM
asrtext: 1.第一句话。;2.第二句话。;
Unique-ID: fe51e722-7210-4f3a-b3a0-fe605344cf52
recordindex:2
recordfile=c:/rec/fe51e722-7210-4f3a-b3a0-fe605344cf52_2.wav

通道变量、提供ASR 状态等通道变量进行有效控制
astyun_speak_ms 说话时长ms
astyun_asr_send 识别提交计数器
astyun_asr_back 识别返回计数器

有不明白 的欢迎留言或看博主名字就是他的微。一起交流学习

相关实践学习
阿里巴巴智能语音交互技术与应用
智能语音交互,是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等。 本课程主要讲解智能语音相关技术,包括语音识别、人机交互、语音合成等。  
目录
打赏
0
0
0
0
17
分享
相关文章
哥大华人开发人脸机器人,照镜子自主模仿人类表情超逼真
【4月更文挑战第3天】哥伦比亚大学研究人员开发了一款名为Emo的机器人,能观察并模仿人类面部表情,实现更自然的人机交互。Emo配备26个面部执行器和高分辨率摄像头,通过“自我建模”学习模仿表情,并能预测人类表情变化。这一创新有望改善人机理解和响应情绪的能力,应用于教育、医疗等领域,但也引发了关于情感依赖和伦理问题的讨论。
187 4
哥大华人开发人脸机器人,照镜子自主模仿人类表情超逼真
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
3023 15
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
Cosmos 是英伟达推出的生成式世界基础模型平台,旨在加速物理人工智能系统的发展,特别是在自动驾驶和机器人领域。
380 15
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
顶顶通电话机器人开发接口对接大语言模型之实时流TTS对接介绍
大语言模型通常流式返回文字,若一次性TTS会导致严重延迟。通过标点断句或流TTS可实现低延迟的文本到语音转换。本文介绍了电话机器人接口适配流TTS的原理及技术点,包括FreeSWITCH通过WebSocket流TTS放音,以及推流协议和旁路流对接的详细说明。
302 1
Dify开发Agent对接钉钉机器人
这篇文章详细讲解了如何在Dify平台上开发一个Agent并与钉钉机器人集成,实现自动化消息处理和响应功能。
687 0
聊天机器人开发的最佳实践:技术探索与案例分析
【8月更文挑战第22天】聊天机器人作为人工智能领域的重要应用之一,正逐步改变着人们的生活和工作方式。通过遵循最佳实践和技术探索,开发者可以开发出更加智能、高效、安全的聊天机器人产品。未来,随着技术的不断进步和应用场景的不断拓展,聊天机器人将在更多领域发挥重要作用。
从零到一:微信机器人开发的实战心得
从零到一:微信机器人开发的实战心得
487 2
语音识别----函数基础定义联系案例,函数的参数,函数的参数练习案例,函数的返回值定义语法,函数返回值之None,函数的说明文档,函数的嵌套调用,变量在函数中的作用域,内部变量变全局变量用global
语音识别----函数基础定义联系案例,函数的参数,函数的参数练习案例,函数的返回值定义语法,函数返回值之None,函数的说明文档,函数的嵌套调用,变量在函数中的作用域,内部变量变全局变量用global

热门文章

最新文章