2019 CES ASIA上,国内专注于边缘AI芯片及解决方案的人工智能企业地平线宣布与新造车企业理想达成合作。
双方合作围绕语音交互技术展开。地平线将为理想ONE增程式智能电动车配备“车载多音区交互技术”,支持多达4路人声分离和6路音区检测,可实现全车多路拾音、人声定位、降噪、回声消除和语音唤醒。
据雷锋网(公众号:雷锋网)了解,在今年年内交付的理想ONE车内,用户可体验到地平线AI赋能的车内智能交互系统。
牵手理想ONE,地平线AI方案率先进入前装量产
如何提高车外车内复杂环境下的语音交互能力,是车企及车内智能交互方案供应商面临的一大难点。
地平线多音区方案利用理想ONE车内的四个高灵敏度麦克风,及地平线的声源定位、盲源分离和降噪算法,进而对不同位置乘客的语音指令的精准区分和识别,快速响应乘客对于车辆设置、导航、音乐、视频等多种需求。
*理想ONE车内的四麦克风布置
雷锋网新智驾了解到,该方案声源定位准确率高达95%,远超市场现有的语音分区方案。
地平线的语音方案能够支持免唤醒命令词达30余个,覆盖导航、娱乐、车控、服务等大多数日常用车场景。这意味着,用户无需语音唤醒,即可轻松进行基本的控制。而近百万条级别的语料训练,使得唤醒和控制更加精准。
地平线牵手理想ONE,这也意味着地平线的AI方案率先进入前装量产。
地平线创始人余凯表示:在此次合作中,地平线将全面开放自身在语音感知方面的能力,并贴身支持理想ONE在研发过程中的数据采集、方案测试、版本迭代、相关软硬件设计等工作。未来,双方将共同探讨基于地平线强大边缘计算和感知能力的更多车内车外交互的可能。
“语音+视觉”双保障,提升更多复杂场景下的语音交互能力
为了应对未来更多车型车内复杂的环境,除了采用降噪和语音算法,地平线还创造性的将语音技术与视觉技术在算法层面进行深度融合。
“语音+视觉”双保障,提升车内的语音感知能力,可以在高噪音、强干扰以及低声量情况下保证高唤醒率和高识别率。
雷锋网新智驾了解到,已成功流片的地平线二代芯片则具备强大的语音和视觉融合计算的能力,能够在边缘端进行手势、情绪、视线等信息的识别,行为分析,以及降噪、唤醒和离线的语音识别,将能够为车载多模交互提供强大的底层感知计算能力。