阿里云创新手册-天猫精灵专场-天猫精灵智能座舱AI能力开放合作交流(上)

简介: 阿里云创新手册-天猫精灵专场-天猫精灵智能座舱AI能力开放合作交流

作者:李大鹏,阿里云人工智能行业产品专家


一、天猫精灵对话

image.png

 

天猫精灵作为个智能音箱品牌,覆盖了超过 4000 多万家庭用户,拥有 5000 多项服务技能,AIoT合作厂商超过 1000 家,拥有超 3. 5 亿的可连接设备以及1600+品牌的智能产品同时,天猫精灵打造了一套AIGenie系统,包含软件、硬件以及相关的 AI 能力,诞生了云端一体的新的 AIoT 产品。

 

image.png 

 

智能音箱包含智能硬件两部分。

 

人工智能包括语音语义能力视觉能力交互能力等,全部由天猫精灵自研。比如语音能力包括了唤醒语音的识别声纹语音的合成视觉能力座舱被广泛使用,包括图像识别人脸识别手势识别交互能力包括多模态交互辨别手势等。除了语音语义能力之外,也提供了通话购物游戏音视频百科知识库等能力

 

相关的硬件产品包括X系列、方糖系列、QUEEN系列等

 

image.png 

 

AIoT领域,天猫精灵实现了十分强大的布局可以提供一站式的语音开发能力、IoT设备控制能力、AI算法集成能力以及数字内容变现能力。

 

image.png 

 

天猫精灵将语音识别、自然语言理解、语音合成、人脸识别与追踪、手势交互等算法整合为一套“AI拟人智能OS系统”,模拟自然人进行人机交互。

 

传统的 AI 能力供应商不一样,天猫精灵是一家消费型智能设备企业,我们希望这套算法能力开放给更多行业伙伴,打造出适用于各行各业的产品

 

image.png 

 

语音识别是一种通用能力,需要很多积累。我们在不同场景使用了很多不同的小模型,通过深度语音管理、融合性识别、个性化场景化识别以及自适应增强等技术,准确理解不同场景下的用户意图,最终实现更精准的文本输出

 

天猫精灵提供了丰富的接入方式,支持安卓、Linux、RTOS三大操作系统,提供软硬一体的模组接入以及灵活的SDK/API使用场景方面,目前支持市面上的全品类家电全屋智能可穿戴设备手表手环眼镜以及智能座舱。

 

image.png

 

视觉交互在座舱场景使用较为广泛

 

首先,视觉算法主要分为 5 大类,包括人脸、手势、动作识别、视觉认知以及文字识别,其中座舱与前面三类相关度较高。如果合作伙伴需要某一种特定的动作来触发某一项操作,也可以进行定制来实现

 

视觉集成能力对上支撑了智能音箱带屏设备座舱VR/AR 眼镜智能家电投影设备学习平板等业务。

 

视觉方面采用了轻量化设计,主要以端侧为主,云端也会运行得更顺畅。另外天猫精灵也实现了整套的数据隐私安全架构。

 

image.png 

 

全球市场的新能源车道快速发展,带动了智能座舱的需求大幅提升。公开数据显示,中国的智能座舱在 2025 年达到 1000 多亿的规模,其中AI 交互份额10%- 15% 。

 

从消费者端来看,智能座舱已经成为购车的关键因素。根据行业调研显示,在中国消费者购车因素中智能座舱已经成为仅次于安全的第二大指标,重要程度超过了动力、价格、能耗因素。

 

从车企端来看传统车企利润较低,大约仅有3%-5%,且无法从后续服务中获利。但是变成一项软件服务之后,可以实现横向营收可以持续为企业盈利。要持续用户输出良好的服务软件服务公司的利润可以达到 15%-20%2021 年,小鹏的服务收入 9. 46 亿元,毛利率 33.2% ,理想汽车服务收入 8. 8 亿元,毛利率达 44%。

 

毫无疑问,智能座舱已经成为车企的必选项,也是汽车行业非常重要的探索指标。

 

那么,天猫精灵能够联合创业伙伴为车企带什么

 

常规版基于标准场景做出差异化,在行业趋同的情况下,利用猫精强大的研发能力,结合行业伙伴的积累,帮助车企做到同类应用体验更智能实现成本更低,比如用领先的端计算优势实现“高实时低功耗”和“降低硬件成本”比如有些车辆原本配置较低,无法运行智能化应用,而在天猫精灵的加持下可运行智能化应用。

 

进阶版帮助车企“平地起飞”,最短的时间在语音车控和多模感知方面,赶上甚至超过行业领先水平

 

高级版让一些真正有领先优势的高科技技术上车,为用户带来新奇体验,比如可交互数字人、原生座舱游戏等,帮助车企在科技体验方面领先1-2年

 

image.png 

 

很多时候,车企负责制造车辆,并且提供优异的设施,比如车机系统、计算平台、内饰摄像头,但是缺少内容,需要创业伙伴上台唱戏,填充相关内容主要包括三大类的内容分别为游戏、内容以及个性化服务。

 

当前车企所需要的是座舱的内容应用+更智能的交互更智能的交互语音、视觉、动物态偏 AI 的能力,而这正是阿里云的强项。

image.png 

 

天猫精灵车载智能监控方案的核心为智能、舒适、个性化。区别于传统的 AI 公司单纯输出算法,天猫精灵面向行业创业伙伴输出完整的、成体系化的三方技能应用,双方协作,一起帮助智能服务上车。

 

大的 AI 厂商会综合考量合作方的项目体量来决定是否接单,而对于天猫精灵而言,只要项目合适,即可快速启动项目并落地。

 

image.png 

天猫精灵具备三大综合算法优势:

 

天猫精灵拥有全套的自研算法体系,从精度到广度持续保持业界领先,并且持续不断打磨算法。

天猫精灵作为C端的智能音箱领军品牌,沉淀了丰富的交互模型经验,可以快速从场景出发,解决用户的核心痛点。比如某车企要在智能座舱里打造一款多模交互的游戏,如果想要实现好的用户体验,则需要针对该款车的硬件配置、光线以及摄头做算法的适配。找一家大厂全程参与打磨产品并不现实,需要花费较高的成本。而天猫精灵本身拥有一套快速的打磨产品的方式以及以用户为中心的理念,可以快速想法落地。

整合输出拟人智能系统。将各种厂商的算法简单地拼凑在一起并不能实现1 + 1>2 的效果。而天猫精灵可以快速输出一整套搭配好的算法,可以快速接入,使车企专注于打磨新的硬件上层的多模交互应用。

 

天猫精灵希望与创业伙伴一起用领先的优势,帮助车企客户打造差异化的竞争力。

 

接下篇:https://developer.aliyun.com/article/1224762?groupCode=chuang

相关文章
|
2天前
|
人工智能 移动开发 前端开发
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
蚂蚁团队推出的AI前端研发平台WeaveFox,能够根据设计图直接生成前端源代码,支持多种应用类型和技术栈,提升开发效率和质量。本文将详细介绍WeaveFox的功能、技术原理及应用场景。
143 66
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
|
12天前
|
机器学习/深度学习 人工智能 UED
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
OOTDiffusion是一款开源的AI虚拟试衣工具,能够智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。该工具支持半身和全身试穿模式,操作简单,适合服装电商、时尚行业从业者及AI试穿技术爱好者使用。
98 27
OOTDiffusion:开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物
|
12天前
|
机器学习/深度学习 Web App开发 人工智能
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
Amurex是一款开源的AI会议助手,提供实时建议、智能摘要、快速回顾关键信息等功能,帮助用户提升会议效率。本文将详细介绍Amurex的功能、技术原理以及如何运行和使用该工具。
67 18
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
|
6天前
|
人工智能 数据库 自然语言处理
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
「拥抱Data+AI」系列文章由阿里云瑶池数据库推出,基于真实客户案例,展示Data+AI行业解决方案。本文通过钉钉AI助理的实际应用,探讨如何利用阿里云Data+AI解决方案实现智能问数服务,使每个人都能拥有专属数据分析师,显著提升数据查询和分析效率。点击阅读详情。
拥抱Data+AI|DMS+AnalyticDB助力钉钉AI助理,轻松玩转智能问数
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
87 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
4天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
1天前
|
JSON 分布式计算 数据处理
加速数据处理与AI开发的利器:阿里云MaxFrame实验评测
随着数据量的爆炸式增长,传统数据分析方法逐渐显现出局限性。Python作为数据科学领域的主流语言,因其简洁易用和丰富的库支持备受青睐。阿里云推出的MaxFrame是一个专为Python开发者设计的分布式计算框架,旨在充分利用MaxCompute的强大能力,提供高效、灵活且易于使用的工具,应对大规模数据处理需求。MaxFrame不仅继承了Pandas等流行数据处理库的友好接口,还通过集成先进的分布式计算技术,显著提升了数据处理的速度和效率。
|
2天前
|
人工智能 大数据 测试技术
自主和开放并举 探索下一代阿里云AI基础设施固件创新
12月13日,固件产业技术创新联盟产业峰会在杭州举行,阿里云主导的开源固件测试平台发布和PCIe Switch固件技术亮相,成为会议焦点。
|
4天前
|
传感器 机器学习/深度学习 人工智能
AI视频监控卫士技术介绍:智能化河道管理解决方案
AI视频监控卫士系统,通过高清摄像头、智能传感器和深度学习技术,实现河道、水库、城市水务及生态保护区的全天候、全覆盖智能监控。系统能够自动识别非法行为、水质变化和异常情况,并实时生成警报,提升管理效率和精准度。
34 13
|
11天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。