牵手理想,地平线如何为理想ONE打造精准全车语音交互

简介: 在今年年内交付的理想ONE车内,用户可体验到地平线AI赋能的车内智能交互系统。
TB1.V4ycBCw3KVjSZFlXXcJkFXa.png

2019 CES ASIA上,国内专注于边缘AI芯片及解决方案的人工智能企业地平线宣布与新造车企业理想达成合作。

双方合作围绕语音交互技术展开。地平线将为理想ONE增程式智能电动车配备“车载多音区交互技术”,支持多达4路人声分离和6路音区检测,可实现全车多路拾音、人声定位、降噪、回声消除和语音唤醒。

据雷锋网(公众号:雷锋网)了解,在今年年内交付的理想ONE车内,用户可体验到地平线AI赋能的车内智能交互系统。

牵手理想ONE,地平线AI方案率先进入前装量产

如何提高车外车内复杂环境下的语音交互能力,是车企及车内智能交互方案供应商面临的一大难点。

地平线多音区方案利用理想ONE车内的四个高灵敏度麦克风,及地平线的声源定位、盲源分离和降噪算法,进而对不同位置乘客的语音指令的精准区分和识别,快速响应乘客对于车辆设置、导航、音乐、视频等多种需求。

TB16VFtcBOD3KVjSZFFXXcn9pXa.png

*理想ONE车内的四麦克风布置

雷锋网新智驾了解到,该方案声源定位准确率高达95%,远超市场现有的语音分区方案。

地平线的语音方案能够支持免唤醒命令词达30余个,覆盖导航、娱乐、车控、服务等大多数日常用车场景。这意味着,用户无需语音唤醒,即可轻松进行基本的控制。而近百万条级别的语料训练,使得唤醒和控制更加精准。

地平线牵手理想ONE,这也意味着地平线的AI方案率先进入前装量产。

地平线创始人余凯表示:在此次合作中,地平线将全面开放自身在语音感知方面的能力,并贴身支持理想ONE在研发过程中的数据采集、方案测试、版本迭代、相关软硬件设计等工作。未来,双方将共同探讨基于地平线强大边缘计算和感知能力的更多车内车外交互的可能。

“语音+视觉”双保障,提升更多复杂场景下的语音交互能力

为了应对未来更多车型车内复杂的环境,除了采用降噪和语音算法,地平线还创造性的将语音技术与视觉技术在算法层面进行深度融合。

“语音+视觉”双保障,提升车内的语音感知能力,可以在高噪音、强干扰以及低声量情况下保证高唤醒率和高识别率。

雷锋网新智驾了解到,已成功流片的地平线二代芯片则具备强大的语音和视觉融合计算的能力,能够在边缘端进行手势、情绪、视线等信息的识别,行为分析,以及降噪、唤醒和离线的语音识别,将能够为车载多模交互提供强大的底层感知计算能力。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
3月前
|
自然语言处理 语音技术
|
3月前
|
机器学习/深度学习 自然语言处理 算法
尖叫!FunAudioLLM 技术掀起狂潮,开启语音交互的惊天巨变之门!
【8月更文挑战第8天】随着科技的进步,语音交互已成为日常不可或缺的部分。FunAudioLLM凭借其先进的自然语言处理和深度学习技术,在语音理解和生成方面实现了突破。相较于传统技术,它提升了理解和响应速度。通过简单的Python代码示例,我们可以测试其对如天气查询等指令的快速准确反馈。FunAudioLLM不仅适用于日常交流,还在医疗、教育等领域展现出应用潜力。尽管存在多语言环境下的准确性挑战,其为语音交互领域带来的革新仍值得期待。随着技术的持续发展,FunAudioLLM将为更多领域带来便利和效率。
67 0
|
传感器 机器学习/深度学习 人工智能
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
随着自媒体与短视频的兴起,人们有了越来越多的拍摄视频的需求。然而由于手持拍摄、硬件限制等原因,利用手机等普通摄影设备拍摄的视频难免存在视频抖动问题。尤其是开启较高倍数的变焦后,手持拍摄很难拍摄到稳定的视频,极易产生抖动的现象。使用云台、斯坦尼康等外设可以缓解这样的抖动,但是很多时候多带一个外设降低了拍摄视频的便利程度,会使得随时随地的拍摄体验大打折扣。
675 0
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
|
人工智能 文字识别 算法
大模型时代来临,智能文档处理该走向何方?(下)
大模型时代来临,智能文档处理该走向何方?
|
机器学习/深度学习 人工智能 测试技术
大模型时代来临,智能文档处理该走向何方?(上)
大模型时代来临,智能文档处理该走向何方?
|
传感器 机器学习/深度学习 人工智能
「纯视觉」与「多传感器」路线之争背后,久未解决的3大难题
「纯视觉」与「多传感器」路线之争背后,久未解决的3大难题
353 0
|
编解码 算法 安全
瑞云科技副总经理黄金进:实时云渲染是实现现实世界和虚拟世界写实视觉效果的关键
2021年12月10日,由广东省游戏产业协会、广东省虚拟现实产业技术创新联盟、深圳市科学技术协会、深圳市互联网文化市场协会指导,陀螺科技主办,深圳市科技开发交流中心、恒悦创客魔方协办,行业头部媒体游戏陀螺、VR陀螺、陀螺电竞、陀螺财经、陀螺传媒联合主办的2021未来商业生态链接大会暨第六届金陀螺奖颁奖典礼(简称“FBEC2021”)在深圳大中华喜来登酒店6楼宴会厅盛大开幕!
瑞云科技副总经理黄金进:实时云渲染是实现现实世界和虚拟世界写实视觉效果的关键
|
机器学习/深度学习 传感器 人工智能
感受洪荒之力!深度传感器搭配机器学习,这个AR应用能制造闪电,还能与现实交互
感受洪荒之力!深度传感器搭配机器学习,这个AR应用能制造闪电,还能与现实交互
223 0
感受洪荒之力!深度传感器搭配机器学习,这个AR应用能制造闪电,还能与现实交互
|
人工智能 Rust 物联网
从语音交互历史浅看它是否会是物联网行业的一个爆点?
近几年得益于人工智能在语音领域的突破,语音AI已经趋于成熟,尤其在智能音箱领域,智能音箱又带来了IoT应用到智能家居。本文主要讨论从语音交互历史看它能否成为物联网新的爆点。
从语音交互历史浅看它是否会是物联网行业的一个爆点?
下一篇
无影云桌面