牵手理想,地平线如何为理想ONE打造精准全车语音交互

简介: 在今年年内交付的理想ONE车内,用户可体验到地平线AI赋能的车内智能交互系统。
TB1.V4ycBCw3KVjSZFlXXcJkFXa.png

2019 CES ASIA上,国内专注于边缘AI芯片及解决方案的人工智能企业地平线宣布与新造车企业理想达成合作。

双方合作围绕语音交互技术展开。地平线将为理想ONE增程式智能电动车配备“车载多音区交互技术”,支持多达4路人声分离和6路音区检测,可实现全车多路拾音、人声定位、降噪、回声消除和语音唤醒。

据雷锋网(公众号:雷锋网)了解,在今年年内交付的理想ONE车内,用户可体验到地平线AI赋能的车内智能交互系统。

牵手理想ONE,地平线AI方案率先进入前装量产

如何提高车外车内复杂环境下的语音交互能力,是车企及车内智能交互方案供应商面临的一大难点。

地平线多音区方案利用理想ONE车内的四个高灵敏度麦克风,及地平线的声源定位、盲源分离和降噪算法,进而对不同位置乘客的语音指令的精准区分和识别,快速响应乘客对于车辆设置、导航、音乐、视频等多种需求。

TB16VFtcBOD3KVjSZFFXXcn9pXa.png

*理想ONE车内的四麦克风布置

雷锋网新智驾了解到,该方案声源定位准确率高达95%,远超市场现有的语音分区方案。

地平线的语音方案能够支持免唤醒命令词达30余个,覆盖导航、娱乐、车控、服务等大多数日常用车场景。这意味着,用户无需语音唤醒,即可轻松进行基本的控制。而近百万条级别的语料训练,使得唤醒和控制更加精准。

地平线牵手理想ONE,这也意味着地平线的AI方案率先进入前装量产。

地平线创始人余凯表示:在此次合作中,地平线将全面开放自身在语音感知方面的能力,并贴身支持理想ONE在研发过程中的数据采集、方案测试、版本迭代、相关软硬件设计等工作。未来,双方将共同探讨基于地平线强大边缘计算和感知能力的更多车内车外交互的可能。

“语音+视觉”双保障,提升更多复杂场景下的语音交互能力

为了应对未来更多车型车内复杂的环境,除了采用降噪和语音算法,地平线还创造性的将语音技术与视觉技术在算法层面进行深度融合。

“语音+视觉”双保障,提升车内的语音感知能力,可以在高噪音、强干扰以及低声量情况下保证高唤醒率和高识别率。

雷锋网新智驾了解到,已成功流片的地平线二代芯片则具备强大的语音和视觉融合计算的能力,能够在边缘端进行手势、情绪、视线等信息的识别,行为分析,以及降噪、唤醒和离线的语音识别,将能够为车载多模交互提供强大的底层感知计算能力。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
4月前
|
机器学习/深度学习 自然语言处理 算法
尖叫!FunAudioLLM 技术掀起狂潮,开启语音交互的惊天巨变之门!
【8月更文挑战第8天】随着科技的进步,语音交互已成为日常不可或缺的部分。FunAudioLLM凭借其先进的自然语言处理和深度学习技术,在语音理解和生成方面实现了突破。相较于传统技术,它提升了理解和响应速度。通过简单的Python代码示例,我们可以测试其对如天气查询等指令的快速准确反馈。FunAudioLLM不仅适用于日常交流,还在医疗、教育等领域展现出应用潜力。尽管存在多语言环境下的准确性挑战,其为语音交互领域带来的革新仍值得期待。随着技术的持续发展,FunAudioLLM将为更多领域带来便利和效率。
74 0
|
7月前
|
人工智能 自然语言处理 安全
AI语音克隆技术企业携手智能硬件制造商革新用户交互体验——ElevenLabs赋能rabbit r1设备实现自然流畅的人机对话
【4月更文挑战第1天】ElevenLabs与rabbit合作,将AI语音克隆技术应用于r1设备,实现自然人机对话。r1借助ElevenLabs的低延迟语音回应技术和rabbit的LAM,提供真实流畅的交互体验。双方旨在创建动态副驾驶般的用户体验,同时,这也预示着智能家居和个人助理产品的未来趋势,即更加人性化和智能化。但科技进步也伴随着隐私和过度依赖的问题,企业需兼顾用户体验与安全。
90 1
AI语音克隆技术企业携手智能硬件制造商革新用户交互体验——ElevenLabs赋能rabbit r1设备实现自然流畅的人机对话
|
传感器 机器学习/深度学习 人工智能
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
随着自媒体与短视频的兴起,人们有了越来越多的拍摄视频的需求。然而由于手持拍摄、硬件限制等原因,利用手机等普通摄影设备拍摄的视频难免存在视频抖动问题。尤其是开启较高倍数的变焦后,手持拍摄很难拍摄到稳定的视频,极易产生抖动的现象。使用云台、斯坦尼康等外设可以缓解这样的抖动,但是很多时候多带一个外设降低了拍摄视频的便利程度,会使得随时随地的拍摄体验大打折扣。
693 0
[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台,使用AI“魔法”让视频稳定起来
|
传感器 机器学习/深度学习 人工智能
「纯视觉」与「多传感器」路线之争背后,久未解决的3大难题
「纯视觉」与「多传感器」路线之争背后,久未解决的3大难题
369 0
|
机器学习/深度学习 人工智能 算法
“柯南领结”变成现实,字节跳动智创语音团队SAMI发布新一代实时AI变声方案
“柯南领结”变成现实,字节跳动智创语音团队SAMI发布新一代实时AI变声方案
344 0
|
机器学习/深度学习 人工智能 机器人
AI智能语音电销机器人能高效取代繁杂的工作
AI智能语音电销机器人能高效取代繁杂的工作
12 0
AI智能语音电销机器人能高效取代繁杂的工作
|
机器学习/深度学习 人工智能 计算机视觉
阿里AI打破视觉对话识别纪录,机器看图说话能力比肩人类
近日, 在第二届视觉对话竞赛Visual Dialogue Challenge中,阿里AI击败了微软、首尔大学等十支参赛队伍,获得冠军。这是阿里巴巴达摩院城市大脑实验室联合阿里巴巴-南洋理工大学联合学院(JRI)等单位取得的又一项世界级技术突破。
1216 0
|
机器学习/深度学习 传感器 人工智能
感受洪荒之力!深度传感器搭配机器学习,这个AR应用能制造闪电,还能与现实交互
感受洪荒之力!深度传感器搭配机器学习,这个AR应用能制造闪电,还能与现实交互
230 0
感受洪荒之力!深度传感器搭配机器学习,这个AR应用能制造闪电,还能与现实交互
|
人工智能 Rust 物联网
从语音交互历史浅看它是否会是物联网行业的一个爆点?
近几年得益于人工智能在语音领域的突破,语音AI已经趋于成熟,尤其在智能音箱领域,智能音箱又带来了IoT应用到智能家居。本文主要讨论从语音交互历史看它能否成为物联网新的爆点。
从语音交互历史浅看它是否会是物联网行业的一个爆点?
|
UED
交互行为蹦失率研究,互联网营销
  上周我做了个有趣的测试,在一个抢票的活动页面中仅有1个按钮,顶端有一个返回主页。按照正常理论思维,用户能点就是这2个位置,不会点击其他的位置,因为没有意义。   然后经过2天,我提取到一些数据,分享一下:   是不是完全与我们想象的有很大差距呢?   虽然购票按钮是最大热区,不过蹦失的鼠标点击行为也有很大一部分,真是太浪费了。
653 0