阿里云创新手册-天猫精灵专场-天猫精灵智能座舱AI能力开放合作交流(上)

简介: 阿里云创新手册-天猫精灵专场-天猫精灵智能座舱AI能力开放合作交流

作者:李大鹏,阿里云人工智能行业产品专家


一、天猫精灵对话

image.png

 

天猫精灵作为个智能音箱品牌,覆盖了超过 4000 多万家庭用户,拥有 5000 多项服务技能,AIoT合作厂商超过 1000 家,拥有超 3. 5 亿的可连接设备以及1600+品牌的智能产品同时,天猫精灵打造了一套AIGenie系统,包含软件、硬件以及相关的 AI 能力,诞生了云端一体的新的 AIoT 产品。

 

image.png 

 

智能音箱包含智能硬件两部分。

 

人工智能包括语音语义能力视觉能力交互能力等,全部由天猫精灵自研。比如语音能力包括了唤醒语音的识别声纹语音的合成视觉能力座舱被广泛使用,包括图像识别人脸识别手势识别交互能力包括多模态交互辨别手势等。除了语音语义能力之外,也提供了通话购物游戏音视频百科知识库等能力

 

相关的硬件产品包括X系列、方糖系列、QUEEN系列等

 

image.png 

 

AIoT领域,天猫精灵实现了十分强大的布局可以提供一站式的语音开发能力、IoT设备控制能力、AI算法集成能力以及数字内容变现能力。

 

image.png 

 

天猫精灵将语音识别、自然语言理解、语音合成、人脸识别与追踪、手势交互等算法整合为一套“AI拟人智能OS系统”,模拟自然人进行人机交互。

 

传统的 AI 能力供应商不一样,天猫精灵是一家消费型智能设备企业,我们希望这套算法能力开放给更多行业伙伴,打造出适用于各行各业的产品

 

image.png 

 

语音识别是一种通用能力,需要很多积累。我们在不同场景使用了很多不同的小模型,通过深度语音管理、融合性识别、个性化场景化识别以及自适应增强等技术,准确理解不同场景下的用户意图,最终实现更精准的文本输出

 

天猫精灵提供了丰富的接入方式,支持安卓、Linux、RTOS三大操作系统,提供软硬一体的模组接入以及灵活的SDK/API使用场景方面,目前支持市面上的全品类家电全屋智能可穿戴设备手表手环眼镜以及智能座舱。

 

image.png

 

视觉交互在座舱场景使用较为广泛

 

首先,视觉算法主要分为 5 大类,包括人脸、手势、动作识别、视觉认知以及文字识别,其中座舱与前面三类相关度较高。如果合作伙伴需要某一种特定的动作来触发某一项操作,也可以进行定制来实现

 

视觉集成能力对上支撑了智能音箱带屏设备座舱VR/AR 眼镜智能家电投影设备学习平板等业务。

 

视觉方面采用了轻量化设计,主要以端侧为主,云端也会运行得更顺畅。另外天猫精灵也实现了整套的数据隐私安全架构。

 

image.png 

 

全球市场的新能源车道快速发展,带动了智能座舱的需求大幅提升。公开数据显示,中国的智能座舱在 2025 年达到 1000 多亿的规模,其中AI 交互份额10%- 15% 。

 

从消费者端来看,智能座舱已经成为购车的关键因素。根据行业调研显示,在中国消费者购车因素中智能座舱已经成为仅次于安全的第二大指标,重要程度超过了动力、价格、能耗因素。

 

从车企端来看传统车企利润较低,大约仅有3%-5%,且无法从后续服务中获利。但是变成一项软件服务之后,可以实现横向营收可以持续为企业盈利。要持续用户输出良好的服务软件服务公司的利润可以达到 15%-20%2021 年,小鹏的服务收入 9. 46 亿元,毛利率 33.2% ,理想汽车服务收入 8. 8 亿元,毛利率达 44%。

 

毫无疑问,智能座舱已经成为车企的必选项,也是汽车行业非常重要的探索指标。

 

那么,天猫精灵能够联合创业伙伴为车企带什么

 

常规版基于标准场景做出差异化,在行业趋同的情况下,利用猫精强大的研发能力,结合行业伙伴的积累,帮助车企做到同类应用体验更智能实现成本更低,比如用领先的端计算优势实现“高实时低功耗”和“降低硬件成本”比如有些车辆原本配置较低,无法运行智能化应用,而在天猫精灵的加持下可运行智能化应用。

 

进阶版帮助车企“平地起飞”,最短的时间在语音车控和多模感知方面,赶上甚至超过行业领先水平

 

高级版让一些真正有领先优势的高科技技术上车,为用户带来新奇体验,比如可交互数字人、原生座舱游戏等,帮助车企在科技体验方面领先1-2年

 

image.png 

 

很多时候,车企负责制造车辆,并且提供优异的设施,比如车机系统、计算平台、内饰摄像头,但是缺少内容,需要创业伙伴上台唱戏,填充相关内容主要包括三大类的内容分别为游戏、内容以及个性化服务。

 

当前车企所需要的是座舱的内容应用+更智能的交互更智能的交互语音、视觉、动物态偏 AI 的能力,而这正是阿里云的强项。

image.png 

 

天猫精灵车载智能监控方案的核心为智能、舒适、个性化。区别于传统的 AI 公司单纯输出算法,天猫精灵面向行业创业伙伴输出完整的、成体系化的三方技能应用,双方协作,一起帮助智能服务上车。

 

大的 AI 厂商会综合考量合作方的项目体量来决定是否接单,而对于天猫精灵而言,只要项目合适,即可快速启动项目并落地。

 

image.png 

天猫精灵具备三大综合算法优势:

 

天猫精灵拥有全套的自研算法体系,从精度到广度持续保持业界领先,并且持续不断打磨算法。

天猫精灵作为C端的智能音箱领军品牌,沉淀了丰富的交互模型经验,可以快速从场景出发,解决用户的核心痛点。比如某车企要在智能座舱里打造一款多模交互的游戏,如果想要实现好的用户体验,则需要针对该款车的硬件配置、光线以及摄头做算法的适配。找一家大厂全程参与打磨产品并不现实,需要花费较高的成本。而天猫精灵本身拥有一套快速的打磨产品的方式以及以用户为中心的理念,可以快速想法落地。

整合输出拟人智能系统。将各种厂商的算法简单地拼凑在一起并不能实现1 + 1>2 的效果。而天猫精灵可以快速输出一整套搭配好的算法,可以快速接入,使车企专注于打磨新的硬件上层的多模交互应用。

 

天猫精灵希望与创业伙伴一起用领先的优势,帮助车企客户打造差异化的竞争力。

 

接下篇:https://developer.aliyun.com/article/1224762?groupCode=chuang

相关文章
|
11天前
|
Web App开发 机器学习/深度学习 人工智能
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
Weebo 是一款基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术的 AI 语音聊天机器人,支持实时语音交互和多语言对话,适用于个人助理、娱乐互动和教育辅导等多种场景。
126 17
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
|
5天前
|
人工智能 Cloud Native 安全
|
12天前
|
人工智能 自然语言处理 测试技术
阿里云通义实验室自然语言处理方向负责人黄非:通义灵码2.0,迈入 Agentic AI
在通义灵码 2.0 发布会上,阿里云通义实验室自然语言处理方向负责人黄非分享了代码大模型的演进。过去一年来,随着大模型技术的发展,特别是智能体技术的深入应用,通义灵码也在智能体的基础上研发了针对于整个软件研发流程的不同任务的智能体,这里既包括单智能体,也包括多智能体合并框架,在这样的基础上我们研发了通义灵码2.0。
103 21
|
4天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
37 10
|
5天前
|
SQL 人工智能 关系型数据库
【PG锦囊】阿里云 RDS PostgreSQL 版插件—AI 插件(rds_ai)
本文介绍了AI 插件(rds_ai)的核心优势、适用场景等,帮助您更好地了解 rds_ai 插件。想了解更多 RDS 插件信息和讨论交流,欢迎加入 RDS PG 插件用户专项服务群(103525002795)
|
13天前
|
人工智能 供应链 安全
阿里云 Confidential AI 最佳实践
本次分享的主题是阿里云 Confidential AI 最佳实践,由阿里云飞天实验室操作系统安全团队工程师张佳分享。主要分为三个部分: 1. Confidential AI 技术背景与挑战 2. Confidential AI 技术架构与应用场景 3. Confidential AI 技术实践与未来展望
|
13天前
|
人工智能 Java API
阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手
本次分享的主题是阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手,由阿里云两位工程师分享。
阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手
|
14天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
11天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
143 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
5天前
|
人工智能 自然语言处理 JavaScript
微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切
微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。
96 14