产品推荐 | 理想的语音大脑是什么样?来看看华镇VB590标准核心板

简介: 日前,华镇语音大脑VB590标准核心板已在OCC上线。该方案针对语音芯片行业应用场景的碎片化、推广周期长,应用场景复杂,缺乏统一语音标准等痛点,推出语音大脑VB590标准核心板,可广泛应用在智能家居,智能卫浴,智能照明,智能机电,智能玩具等场景领域。

日前,华镇语音大脑VB590标准核心板已在OCC上线。该方案针对语音芯片行业应用场景的碎片化、推广周期长,应用场景复杂,缺乏统一语音标准等痛点,推出语音大脑VB590标准核心板,可广泛应用在智能家居,智能卫浴,智能照明,智能机电,智能玩具等场景领域。

方案介绍

VB590标准核心板,采用高灵敏度模拟麦克风录音,利用稳态、动态噪音过滤算法,动态调整录音音量,录音降噪后通过语音增强,将高信噪比的语料数据送到识别引擎去做识别,保证了不同距离识别的高精准度和抗噪能力,适合远距离或嘈杂环境下真实复杂场景下的语音识别、语音控制。系统无需WiFi、无需APP并识别灵敏,内置VB590AI语音识别芯片,用于极速语音操控能力,用户可以通过语音实现和设备的交互控制,带来简单快捷的使用体验。

针对离线语音识别客制化程度高的特点,VB590方案实现SDK完全开放,自定义语音识别指令集,开发者可以连接华镇服务器训练对应的语音模型。训练方法简便,通过文本编辑的方式,就可以实现包括唤醒词在内的针对不同客户的语音模型。

四大优势让家庭控制更加智能化

【语音识别AI算法】基于第二代TDNN-LFMMI模型,识别率较第一代DNN-HMM 模型有巨大优势,提高6%以上。

【多语种声学模型】具备中文普通话、北美英语、英式英语的识别能力,能够覆盖绝大多数带方言的普通话识别场景。中文模型包括了近2万小时,英文模型包括了近1万小时。

【前端声学处理算法】支持语音增强、语音降噪、实现单麦远场识别。

【客制化服务】SDK完全开放,提供自定义识别指令集, 开发者可以连接华镇服务器训练对应的语音模型。

94C90BB1-3C04-4b9a-8E1B-949BCABC82CC.png

芯片方面

VB590采用了平头哥高性能32位处理器XT804。芯片上运行语音识别算法、语音降噪算法、语音增强算法实现了远场离线语音识别。芯片内置语音识别神经网络计算所需要的DSP指令增强单元以及MCA算法硬件加速器,AI算法与芯片架构深度融合,算力和效能之间取得非常好的平衡。

VB590芯片内置集成了128KB SRAM、2MB FlASH、ADC、DAC,外围BOM极其简单。芯片支持中文、英文离线语音指令识别、远场识别、强噪音下识别,完全是高性价比离线识别芯片同时还支持二次开发,开发者可以自定义语音识别指令,从研发到量产,提供全流程服务。

此款产品已在OCC上线,更多产品详情可扫描下方二维码查看。

C9576F8F-26C0-49b1-AF2E-EC652899C7F9.png

公司介绍

上海华镇电子科技有限公司成立于2006年,拥有近百项专利及软件著作权。是国家高新技术企业,软件企业并连续多年获得上海市双创大赛奖项,华镇拥有多项人工智能核心算法,如:声学前端的麦克风阵列(SMA)、远声降噪(NS)、回声抑制(AEC)、人工智能深度神经网络语音识别(KWS、ASR)、声纹识别(VPR)等核心算法,有着丰富的研究及项目落地的经验。华镇聚合核心算法能力推出全方位赋能百业的人工智能开放平台——语音大脑VoiceBrain开放平台,作为软硬件全链条能力的企业,华镇可以为客户提供一站式Turnkey服务,让我们的合作伙伴用最小的成本,简单、便捷的用上AI系统。

来源:芯片开放社区 微信公众号
原文链接:https://mp.weixin.qq.com/s?__biz=MzIxMDMxMDQxNA==&mid=2247484433&idx=1&sn=b9fdd9d0f53b25465208abd78a7eada1&chksm=9767c070a0104966df35cbe675d68a89fd0984d9677f8809ff81f43fae17d2ddbb6668aeec97&token=1131223069&lang=zh_CN

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
1天前
|
机器学习/深度学习 人工智能 安全
机器人+AI+MD模拟,加速材料发现和设计,发现全天然塑料替代品
【5月更文挑战第16天】研究人员结合机器人自动化、AI和MD模拟,加速发现全天然塑料替代品,以解决塑料污染问题。通过机器人制备286种纳米复合材料,使用SVM和ANN模型预测其性能,实现高效设计。模型成功推荐了具有特定性能的生物降解替代品,但面临样品制备自动化、天然成分质量控制、成本和生命周期分析等挑战。论文链接:[Nature article](https://www.nature.com/articles/s41565-024-01635-z)
14 3
|
3天前
|
存储 算法 定位技术
LabVIEW和NIUSRP硬件加快了认知无线电开发
LabVIEW和NIUSRP硬件加快了认知无线电开发
10 1
|
3天前
|
传感器 算法 机器人
在实用化人形机器人控制系统中深入应用FPGA的框架设计(基于特斯拉Optimus-Gen2的硬件系统)
针对实用化人形机器人的控制系统,以深入应用FPGA技术为指导思想做了一个框架设计,提供一个具象化的设计实例、参考技术方案,协助各研发团队及相关决策者了解这一技术思路的价值。 进而,笔者希望读者将这个框架设计与《在实用化人形机器人研发流程中深入应用FPGA技术的流程图》结合起来进行分析、思考,希望: 进一步降低将FPGA深入应用于人形机器人在纯粹技术维度上的门槛; 助力更多正在人形机器人领域参与竞争的团队 -- 及时做出实质性决策,及时将更多资源分配到深入应用FPGA技术这一竞争维度。
98 4
在实用化人形机器人控制系统中深入应用FPGA的框架设计(基于特斯拉Optimus-Gen2的硬件系统)
|
3天前
|
算法 安全 数据可视化
开题报告-基于嵌入式的数字水印叠加系统与实现
开题报告-基于嵌入式的数字水印叠加系统与实现
|
12月前
|
人工智能 监控 机器人
多个ChatGPT合作完成指定任务,迷你AGI控制世界要来了?(1)
多个ChatGPT合作完成指定任务,迷你AGI控制世界要来了?
134 0
西门子S7-200 SMART运动控制功能,编写程序并测试,运动控制面板
本篇我们来学习编写程序并测试以及如何使用运动控制面板。编写程序,首先将初始化速度送至相关存储区,再编写使能驱动程序,M2.0为1时使能驱动器,调用轴控制子程序,编写输入输出参数,输入端填写SM0.0,表示每个扫描周期都要使能该子程序。
西门子S7-200 SMART运动控制功能,编写程序并测试,运动控制面板
西门子S7-200 SMART运动控制功能,运动轴组态,运动控制程序编写测试
今天我们来介绍一下西门子S7-200 SMART运动控制功能,下面我们先来学习如何使用向导组态运动轴。
西门子S7-200 SMART运动控制功能,运动轴组态,运动控制程序编写测试
|
传感器
嵌入式小项目练习-光电设计竞赛-寻迹小车-02-模块分析
嵌入式小项目练习-光电设计竞赛-寻迹小车-02-模块分析
138 0
嵌入式小项目练习-光电设计竞赛-寻迹小车-02-模块分析
嵌入式小项目练习-光电设计竞赛-寻迹小车-01-赛题与流程图
嵌入式小项目练习-光电设计竞赛-寻迹小车-01-赛题与流程图
185 0
嵌入式小项目练习-光电设计竞赛-寻迹小车-01-赛题与流程图
|
物联网 Linux 芯片
启明云端分享:基于工业级嵌入式核心板卡制作而成的核心模块
WT-ARM9X25-S2 核心模块是基于 ATMEL AT91SAM9X25 ARM9 处理器的工业级嵌入式核心板卡,采用表贴式邮票口封装, 4cm X 4cm 超小尺寸, 108 引脚。该产品主要面向工业控制,仪表仪器,医疗电子,物联网网关等应用, 可以帮助客户快速开发高可靠性产品。
170 0
启明云端分享:基于工业级嵌入式核心板卡制作而成的核心模块