Freesiwtch VAD语音识别模块参数-开发电话智能语音机器人

简介: Freesiwtch VAD语音识别模块参数-开发电话智能语音机器人

Freesiwtch VAD语音识别模块参数-开发电话语音机器人
1、高性能商业VAD静音检测模块、噪音过滤、自动增益模块
2、无损不压缩采集方式,识别效率全国最高
3、异步说话、多句话, 整句话事件
4、最小说话时间、最大说话时间、最小停顿时间、最大停顿时间

ast_start_asr 说明
ast_start_asr 是一个异步函数, 说话完成自动停止 ,也可以调用ast_sotp_asr 结束识别

ast_start_asr [] [] [] [] []

configure_name asr配置文件名。可以不同呼叫使用不同的ASR配置。
min_speak_ms 最小说话时间,默认值200,单位毫秒,说话时间小于这个值,会被认为是空音。
max_speak_ms 最大说话时间,默认值10000,单位毫秒,说话时间超过这个值,就停止录音,提交ASR服务器识别。
min_pause_ms 最小停顿时间,默认值300,单位毫秒,默认值用户停顿时间超过这个值,多句话中的一句话完成,发送 ast_asrprogress事件
max_pause_ms 最大停顿时间,默认值600,单位毫秒,用户停顿时间超过这个值,认为一句话说完,所有识别完成后发送ast_asrmessage事件
ast_stop_asr
停止ASR。

Feeswtich 订阅 事件
CUSTOM ast_asrprogress ast_asrmessage

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: ast_asrprogress
Event-Name: CUSTOM
asrtext_sub: 第一句话。;
asrelapse: 394
recordindex:1
Unique-ID: fe51e722-7210-4f3a-b3a0-fe605344cf52
recordfile=c:/rec/fe51e722-7210-4f3a-b3a0-fe605344cf52_1.wav

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: ast_asrprogress
Event-Name: CUSTOM
asrtext_sub: 第二句话。;
asrelapse: 340
recordindex:2
Unique-ID: fe51e722-7210-4f3a-b3a0-fe605344cf52
recordfile=c:/rec/fe51e722-7210-4f3a-b3a0-fe605344cf52_2.wav

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Event-Subclass: ast_asrmessage
Event-Name: CUSTOM
asrtext: 1.第一句话。;2.第二句话。;
Unique-ID: fe51e722-7210-4f3a-b3a0-fe605344cf52
recordindex:2
recordfile=c:/rec/fe51e722-7210-4f3a-b3a0-fe605344cf52_2.wav

通道变量、提供ASR 状态等通道变量进行有效控制
astyun_speak_ms 说话时长ms
astyun_asr_send 识别提交计数器
astyun_asr_back 识别返回计数器

有不明白 的欢迎留言或看博主名字就是他的微。一起交流学习

相关实践学习
阿里巴巴智能语音交互技术与应用
智能语音交互,是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等。 本课程主要讲解智能语音相关技术,包括语音识别、人机交互、语音合成等。  
目录
相关文章
|
机器人
智能电话机器人源码系统 的VAD和CNG
概观 VAD概述 VAD代表语音活动检测。它的作用是区分声音和其他任何东西,包括沉默。在VoIP应用中,它可以用作最小化传输的音频分组数量的工具。如果没有人说话,则可以停止音频数据包的流动,或者至少改变为低得多的舒适噪声数据包
|
3月前
|
Ubuntu 机器人 语音技术
语音识别与语音控制的原理介绍
硬件平台 机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版 运行案例 首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。 cd /userdata/dev_ws/ # 配置TogetheROS环境 source /opt/tros/setup.bash # 从tros.b的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载音频驱动,设备启动之后只
235 83
|
2月前
|
Ubuntu 机器人 语音技术
语音识别与语音控制
【10月更文挑战第4天】硬件平台 机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版 运行案例 首先进入OriginBot主控系统,运行一下指令。请注意,部分操作OriginBot内暂未放入,请根据内容进行适当处理。 cd /userdata/dev_ws/ # 配置TogetheROS环境 source /opt/tros/setup.bash # 从tros.b的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载
|
3月前
|
人工智能 自然语言处理 搜索推荐
如何让智能客服像真人一样对话?容联七陌揭秘:多Agent大模型
科技云报到原创。 经历了多年的“答非所问”、“一问三不知”,很多人已经厌倦了所谓的“智能客服”。哪怕是技术已经非常成熟、可以模拟真人发音的外呼机器人,也会因为“机感”重而被用户迅速挂机或转向人工客服。 智能客服似乎遇到了一道坎,在理解用户、和用户对话方面,始终无法实现真正的“智能”。然而大模型技术的出现,让智能客服看到了前所未有的曙光——基于大模型特有的生成式技术和智能的涌现,让智能客服越来越逼近人们想象中的样子。 但问题是,仅有大模型就够了吗?大模型技术要如何引入智能客服才能落地?落地后的大模型究竟如何在智能客服具体场景中发挥作用?又能为客服行业带来了哪些改变?更进一步,对于企业和
226 1
如何让智能客服像真人一样对话?容联七陌揭秘:多Agent大模型
|
2月前
|
存储 Serverless API
打造你的专属语音助手,基于函数计算托管 CosyVoice 语音模型
打造你的专属语音助手,基于函数计算托管 CosyVoice 语音模型
|
5月前
|
机器学习/深度学习 自然语言处理 搜索推荐
通义语音大模型评测:迈向更自然、更智能的语音交互
随着人工智能技术的迅猛发展,语音识别和自然语言处理领域不断涌现出新的模型和应用。阿里云推出的通义语音大模型,正是在这一背景下应运而生。本文将对通义语音大模型进行详细评测,探讨其技术架构、应用场景、性能表现以及未来发展前景。
424 0
|
7月前
|
人工智能 机器人 Android开发
ChatGPT新增朗读功能,可以语音播报生成结果
【2月更文挑战第15天】ChatGPT新增朗读功能,可以语音播报生成结果
172 1
ChatGPT新增朗读功能,可以语音播报生成结果
|
机器学习/深度学习 传感器 资源调度
【语音识别】基于适量量化(VQ)实现说话人门禁识别附GUI
【语音识别】基于适量量化(VQ)实现说话人门禁识别附GUI
|
机器学习/深度学习 Linux API
【超简单】之基于PaddleSpeech搭建个人语音听写服务
【超简单】之基于PaddleSpeech搭建个人语音听写服务
945 0
【超简单】之基于PaddleSpeech搭建个人语音听写服务
|
人工智能 机器人 人机交互
智能电话机器人的语音识别究竟是如何实现的
智能化生活:当你睁开眼睛体味着清晨的第一抹阳光,智能设备就已经在自动工作了,机器人帮你打扫屋子,处理文件,烹饪早餐,走出街道,搭乘AI汽车,进入公司,迎面就是智能前台,在工作中收到的电话或者信息,都有可能实现智能化处理,这些场景在很多年以前是不敢想象的,但在如今已经大部分都得到了实现。 作为人工智能基础研究的语音识别技术,一直都是横亘在研究者面前的难关,而让计算机能够明白人类的语言,实现人机对话已经研究了近30年!从思维模型到具体实现,科学研究者攻克了无数的难关,那么我们今天就来了解一下神秘的语音识别技术吧! 什么是智能语音识别系统?语音识别实际就是将人类说话的内容和意思转化为计算机可读的