日前,华镇语音大脑VB590标准核心板已在OCC上线。该方案针对语音芯片行业应用场景的碎片化、推广周期长,应用场景复杂,缺乏统一语音标准等痛点,推出语音大脑VB590标准核心板,可广泛应用在智能家居,智能卫浴,智能照明,智能机电,智能玩具等场景领域。
方案介绍
VB590标准核心板,采用高灵敏度模拟麦克风录音,利用稳态、动态噪音过滤算法,动态调整录音音量,录音降噪后通过语音增强,将高信噪比的语料数据送到识别引擎去做识别,保证了不同距离识别的高精准度和抗噪能力,适合远距离或嘈杂环境下真实复杂场景下的语音识别、语音控制。系统无需WiFi、无需APP并识别灵敏,内置VB590AI语音识别芯片,用于极速语音操控能力,用户可以通过语音实现和设备的交互控制,带来简单快捷的使用体验。
针对离线语音识别客制化程度高的特点,VB590方案实现SDK完全开放,自定义语音识别指令集,开发者可以连接华镇服务器训练对应的语音模型。训练方法简便,通过文本编辑的方式,就可以实现包括唤醒词在内的针对不同客户的语音模型。
四大优势让家庭控制更加智能化
【语音识别AI算法】基于第二代TDNN-LFMMI模型,识别率较第一代DNN-HMM 模型有巨大优势,提高6%以上。
【多语种声学模型】具备中文普通话、北美英语、英式英语的识别能力,能够覆盖绝大多数带方言的普通话识别场景。中文模型包括了近2万小时,英文模型包括了近1万小时。
【前端声学处理算法】支持语音增强、语音降噪、实现单麦远场识别。
【客制化服务】SDK完全开放,提供自定义识别指令集, 开发者可以连接华镇服务器训练对应的语音模型。
芯片方面
VB590采用了平头哥高性能32位处理器XT804。芯片上运行语音识别算法、语音降噪算法、语音增强算法实现了远场离线语音识别。芯片内置语音识别神经网络计算所需要的DSP指令增强单元以及MCA算法硬件加速器,AI算法与芯片架构深度融合,算力和效能之间取得非常好的平衡。
VB590芯片内置集成了128KB SRAM、2MB FlASH、ADC、DAC,外围BOM极其简单。芯片支持中文、英文离线语音指令识别、远场识别、强噪音下识别,完全是高性价比离线识别芯片同时还支持二次开发,开发者可以自定义语音识别指令,从研发到量产,提供全流程服务。
此款产品已在OCC上线,更多产品详情可扫描下方二维码查看。
公司介绍
上海华镇电子科技有限公司成立于2006年,拥有近百项专利及软件著作权。是国家高新技术企业,软件企业并连续多年获得上海市双创大赛奖项,华镇拥有多项人工智能核心算法,如:声学前端的麦克风阵列(SMA)、远声降噪(NS)、回声抑制(AEC)、人工智能深度神经网络语音识别(KWS、ASR)、声纹识别(VPR)等核心算法,有着丰富的研究及项目落地的经验。华镇聚合核心算法能力推出全方位赋能百业的人工智能开放平台——语音大脑VoiceBrain开放平台,作为软硬件全链条能力的企业,华镇可以为客户提供一站式Turnkey服务,让我们的合作伙伴用最小的成本,简单、便捷的用上AI系统。