传感器融合: 雷达和MEMS麦克风结合音频处理器实现无与伦比的语音识别

简介:

英飞凌科技股份公司(FSE: IFX / OTCQX: IFNNY)携手XMOS有限公司推出全新的语音识别构件。该构件将英飞凌的雷达和硅麦克风传感器与XMOS 的音频处理器相结合,通过音频波束成形和雷达目标位置检测进行远场语音识别。这些器件融合在一起能够实现最优语音识别,并能实现语音控制设备的完美执行。目标应用主要包括智能家居、智能电视和机顶盒、安全无钥匙进入系统和其他声控消费电子设备。

当前MEMS 麦克风的性能会限制系统的有效性:在多人语音时,声源的真实性和位置不能被准确识别,而且无法与无生命体噪音分离。英飞凌带有天线的60 GHz 2Tx/4Rx雷达IC和70dB SNR麦克风可以帮助克服这些问题。该麦克风基于英飞凌的双背极MEMS技术,十分适合远场语音捕获和波束成形。此外,麦克风信噪比的优化将进一步提升性能。

XMOS音频处理器分析来自英飞凌数字麦克风阵列的信号数据,调整每个麦克风的角度和距离数据,以雷达数据确定的角度形成声束。LED灯指示在场检测和声源位置。

英飞凌雷达与XMOS 波束成形器的结合有助于麦克风准确地瞄准具体目标,即使目标在移动或有微弱噪音。与现有声控系统相比,该麦克风可提供卓越的用户体验,同时明确理解指令和实现完美执行,防止设备意外启动。

关于英飞凌

英飞凌科技股份公司是全球领先的半导体科技公司,我们让人们的生活更加便利、安全和环保。英飞凌的微电子产品和解决方案将带您通往美好的未来。2016财年(截止9月30日),公司的销售额达65亿欧元,在全球范围内拥有约36,300名员工。英飞凌在法兰克福证券交易所(股票代码:IFX)和美国柜台交易市场 OTCQX International Premier(股票代码:IFNNY)挂牌上市。

英飞凌中国

英飞凌科技股份公司于1995年正式进入中国市场。自1995年10月在无锡建立第一家企业以来,英飞凌的业务取得非常迅速的增长,在中国拥有约2000名员工,已经成为英飞凌亚太乃至全球业务发展的重要推动力。英飞凌在中国建立了涵盖研发、生产、销售、市场、技术支持等在内的完整的产业链,并在销售、技术研发、人才培养等方面与国内领先的企业、高等院校开展了深入的合作。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
3月前
|
语音技术
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)【1月更文挑战第11天】【1月更文挑战第52篇】
33 1
|
3月前
|
语音技术
要将`modelscope-funasr`的输出从`Paraformer语音识别-中文-通用-16k-离线-large-长音频版-onnx`更改
【1月更文挑战第7天】【1月更文挑战第35篇】要将`modelscope-funasr`的输出从`Paraformer语音识别-中文-通用-16k-离线-large-长音频版-onnx`更改
80 3
|
Java API 语音技术
使用FFmpeg进行视频抽取音频,之后进行语音识别转为文字
使用FFmpeg进行视频抽取音频,之后进行语音识别转为文字
563 0
|
API 语音技术 Python
Python语音转文字、音频切割、语音识别
不知道你有没有录过自我介绍的视频,尤其是那种加上PPT播放的长时间视频 可能因为说错一句话就得重来,又或者因为思考而暂停时间太久又得重来,以至于弄了两个小时才做好五分钟的视频
1974 0
Python语音转文字、音频切割、语音识别
|
大数据 Java 开发工具
使用智能语音交互识别视频中的音频
本文将介绍如何将视频文件中的音频剥离出来并使用阿里云智能语音交互的录音文件识别功能进行识别。 环境准备 本文以Windows环境为例,请确保Git,Maven, Java已经安装并配置成功。 开通智能语音交互服务,具体步骤请参考:开通服务。
1884 0
|
API 语音技术 Python
Python 技术篇-百度语音识别API接口调用演示
Python 技术篇-百度语音识别API接口调用演示
380 0
Python 技术篇-百度语音识别API接口调用演示
|
1月前
|
机器学习/深度学习 自然语言处理 语音技术
语音识别技术的原理与应用
语音识别技术的原理与应用
|
4月前
|
机器学习/深度学习 自然语言处理 人机交互
语音识别技术的发展与未来趋势:深度学习、端到端建模与多模态融合
语音识别技术的发展与未来趋势:深度学习、端到端建模与多模态融合
161 0
语音识别技术的发展与未来趋势:深度学习、端到端建模与多模态融合
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
听懂未来:AI语音识别技术的进步与实战
听懂未来:AI语音识别技术的进步与实战
164 0
|
9月前
|
人工智能 编解码 API
C# 10分钟完成百度语音技术(语音识别与合成)——入门篇
C# 10分钟完成百度语音技术(语音识别与合成)——入门篇