阿里云创新手册-天猫精灵专场-天猫精灵智能座舱AI能力开放合作交流(上)

简介: 阿里云创新手册-天猫精灵专场-天猫精灵智能座舱AI能力开放合作交流

作者:李大鹏,阿里云人工智能行业产品专家


一、天猫精灵对话

image.png

 

天猫精灵作为个智能音箱品牌,覆盖了超过 4000 多万家庭用户,拥有 5000 多项服务技能,AIoT合作厂商超过 1000 家,拥有超 3. 5 亿的可连接设备以及1600+品牌的智能产品同时,天猫精灵打造了一套AIGenie系统,包含软件、硬件以及相关的 AI 能力,诞生了云端一体的新的 AIoT 产品。

 

image.png 

 

智能音箱包含智能硬件两部分。

 

人工智能包括语音语义能力视觉能力交互能力等,全部由天猫精灵自研。比如语音能力包括了唤醒语音的识别声纹语音的合成视觉能力座舱被广泛使用,包括图像识别人脸识别手势识别交互能力包括多模态交互辨别手势等。除了语音语义能力之外,也提供了通话购物游戏音视频百科知识库等能力

 

相关的硬件产品包括X系列、方糖系列、QUEEN系列等

 

image.png 

 

AIoT领域,天猫精灵实现了十分强大的布局可以提供一站式的语音开发能力、IoT设备控制能力、AI算法集成能力以及数字内容变现能力。

 

image.png 

 

天猫精灵将语音识别、自然语言理解、语音合成、人脸识别与追踪、手势交互等算法整合为一套“AI拟人智能OS系统”,模拟自然人进行人机交互。

 

传统的 AI 能力供应商不一样,天猫精灵是一家消费型智能设备企业,我们希望这套算法能力开放给更多行业伙伴,打造出适用于各行各业的产品

 

image.png 

 

语音识别是一种通用能力,需要很多积累。我们在不同场景使用了很多不同的小模型,通过深度语音管理、融合性识别、个性化场景化识别以及自适应增强等技术,准确理解不同场景下的用户意图,最终实现更精准的文本输出

 

天猫精灵提供了丰富的接入方式,支持安卓、Linux、RTOS三大操作系统,提供软硬一体的模组接入以及灵活的SDK/API使用场景方面,目前支持市面上的全品类家电全屋智能可穿戴设备手表手环眼镜以及智能座舱。

 

image.png

 

视觉交互在座舱场景使用较为广泛

 

首先,视觉算法主要分为 5 大类,包括人脸、手势、动作识别、视觉认知以及文字识别,其中座舱与前面三类相关度较高。如果合作伙伴需要某一种特定的动作来触发某一项操作,也可以进行定制来实现

 

视觉集成能力对上支撑了智能音箱带屏设备座舱VR/AR 眼镜智能家电投影设备学习平板等业务。

 

视觉方面采用了轻量化设计,主要以端侧为主,云端也会运行得更顺畅。另外天猫精灵也实现了整套的数据隐私安全架构。

 

image.png 

 

全球市场的新能源车道快速发展,带动了智能座舱的需求大幅提升。公开数据显示,中国的智能座舱在 2025 年达到 1000 多亿的规模,其中AI 交互份额10%- 15% 。

 

从消费者端来看,智能座舱已经成为购车的关键因素。根据行业调研显示,在中国消费者购车因素中智能座舱已经成为仅次于安全的第二大指标,重要程度超过了动力、价格、能耗因素。

 

从车企端来看传统车企利润较低,大约仅有3%-5%,且无法从后续服务中获利。但是变成一项软件服务之后,可以实现横向营收可以持续为企业盈利。要持续用户输出良好的服务软件服务公司的利润可以达到 15%-20%2021 年,小鹏的服务收入 9. 46 亿元,毛利率 33.2% ,理想汽车服务收入 8. 8 亿元,毛利率达 44%。

 

毫无疑问,智能座舱已经成为车企的必选项,也是汽车行业非常重要的探索指标。

 

那么,天猫精灵能够联合创业伙伴为车企带什么

 

常规版基于标准场景做出差异化,在行业趋同的情况下,利用猫精强大的研发能力,结合行业伙伴的积累,帮助车企做到同类应用体验更智能实现成本更低,比如用领先的端计算优势实现“高实时低功耗”和“降低硬件成本”比如有些车辆原本配置较低,无法运行智能化应用,而在天猫精灵的加持下可运行智能化应用。

 

进阶版帮助车企“平地起飞”,最短的时间在语音车控和多模感知方面,赶上甚至超过行业领先水平

 

高级版让一些真正有领先优势的高科技技术上车,为用户带来新奇体验,比如可交互数字人、原生座舱游戏等,帮助车企在科技体验方面领先1-2年

 

image.png 

 

很多时候,车企负责制造车辆,并且提供优异的设施,比如车机系统、计算平台、内饰摄像头,但是缺少内容,需要创业伙伴上台唱戏,填充相关内容主要包括三大类的内容分别为游戏、内容以及个性化服务。

 

当前车企所需要的是座舱的内容应用+更智能的交互更智能的交互语音、视觉、动物态偏 AI 的能力,而这正是阿里云的强项。

image.png 

 

天猫精灵车载智能监控方案的核心为智能、舒适、个性化。区别于传统的 AI 公司单纯输出算法,天猫精灵面向行业创业伙伴输出完整的、成体系化的三方技能应用,双方协作,一起帮助智能服务上车。

 

大的 AI 厂商会综合考量合作方的项目体量来决定是否接单,而对于天猫精灵而言,只要项目合适,即可快速启动项目并落地。

 

image.png 

天猫精灵具备三大综合算法优势:

 

天猫精灵拥有全套的自研算法体系,从精度到广度持续保持业界领先,并且持续不断打磨算法。

天猫精灵作为C端的智能音箱领军品牌,沉淀了丰富的交互模型经验,可以快速从场景出发,解决用户的核心痛点。比如某车企要在智能座舱里打造一款多模交互的游戏,如果想要实现好的用户体验,则需要针对该款车的硬件配置、光线以及摄头做算法的适配。找一家大厂全程参与打磨产品并不现实,需要花费较高的成本。而天猫精灵本身拥有一套快速的打磨产品的方式以及以用户为中心的理念,可以快速想法落地。

整合输出拟人智能系统。将各种厂商的算法简单地拼凑在一起并不能实现1 + 1>2 的效果。而天猫精灵可以快速输出一整套搭配好的算法,可以快速接入,使车企专注于打磨新的硬件上层的多模交互应用。

 

天猫精灵希望与创业伙伴一起用领先的优势,帮助车企客户打造差异化的竞争力。

 

接下篇:https://developer.aliyun.com/article/1224762?groupCode=chuang

相关文章
|
7天前
|
人工智能 自然语言处理 搜索推荐
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
在新加坡 ElasticON 2025 的 Elastic 合作伙伴峰会上,阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024!
|
7天前
|
机器学习/深度学习 人工智能 搜索推荐
DeepSeek 速成指南:普通人也能秒懂的 AI 实战手册
DeepSeek 是一款强大的中文大语言模型,能处理长文本、多模态输入,适用于职场、学习、生活等场景。它擅长文案创作、数据分析与复杂任务拆解,相比 ChatGPT,在中文表达和网络热梗上更具优势。掌握精准提问、结果校验和效率工具三大技能,可大幅提升使用效果。同时,避免过度依赖、隐私泄露和伦理模糊的“三大天坑”,并通过角色扮演、思维链拆解等进阶技巧挖掘潜力。DeepSeek 不是替代品,而是助力你高效完成任务、拓展知识边界的超级大脑。未来属于善于与 AI 协作的人,立即行动,设计专属协作流程!
43 0
DeepSeek 速成指南:普通人也能秒懂的 AI 实战手册
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下。 第一篇文章指路👉《AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了》
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
|
13天前
|
人工智能 运维 安全
更低成本、更高效、更安全!阿里云与钉钉联合推出协同办公AI解决方案
阿里云与钉钉携手推出了全新的“钉钉·AI Stack一体机”,以“低成本、高安全、零门槛”为核心,为用户提供基于钉钉,从模型部署到全员落地的AI解决方案,开启智能化办公的“一键加速”。
|
14天前
|
存储 人工智能 Cloud Native
小鹏汽车选用阿里云PolarDB,开启AI大模型训练新时代
PolarDB-PG云原生分布式数据库不仅提供了无限的扩展能力,还借助丰富的PostgreSQL生态系统,统一了后台技术栈,极大地简化了运维工作。这种强大的组合不仅提高了系统的稳定性和性能,还为小鹏汽车大模型训练的数据管理带来了前所未有的灵活性和效率。
|
13天前
|
存储 人工智能 运维
阿里云操作系统控制台评测:国产AI+运维 一站式运维管理平台
本文详细评测了阿里云操作系统控制台,作为一款集运维管理、智能助手和系统诊断于一体的工具,它为企业提供了高效管理云资源的解决方案。文章涵盖登录与服务开通、系统管理与实例纳管、组件管理与扩展功能、系统诊断与问题排查以及实时热点分析与性能优化等内容。通过实际操作展示,该平台显著提升了运维效率,并借助AI智能助手简化了复杂操作。建议进一步完善组件库并增强第三方兼容性,以满足更多高级运维需求。
52 0
|
23天前
|
人工智能 弹性计算 Ubuntu
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
本文介绍了如何使用阿里云提供的DeepSeek-R1大模型解决方案,通过Chatbox和Dify平台调用百炼API,实现稳定且高效的模型应用。首先,文章详细描述了如何通过Chatbox配置API并开始对话,适合普通用户快速上手。接着,深入探讨了使用Dify部署AI应用的过程,包括选购云服务器、安装Dify、配置对接DeepSeek-R1模型及创建工作流,展示了更复杂场景下的应用潜力。最后,对比了Chatbox与Dify的输出效果,证明Dify能提供更详尽、精准的回复。总结指出,阿里云的解决方案不仅操作简便,还为专业用户提供了强大的功能支持,极大提升了用户体验和应用效率。
1078 19
从零开始即刻拥有 DeepSeek-R1 满血版并使用 Dify 部署 AI 应用
|
16天前
|
人工智能 前端开发 JavaScript
AI程序员:通义灵码 2.0应用VScode前端开发深度体验
AI程序员:通义灵码 2.0应用VScode前端开发深度体验,在软件开发领域,人工智能技术的融入正深刻改变着程序员的工作方式。通义灵码 2.0 作为一款先进的 AI 编程助手,与广受欢迎的代码编辑器 Visual Studio Code(VScode)相结合,为前端开发带来了全新的可能性。本文将详细分享通义灵码 2.0 在 VScode 前端开发环境中的深度使用体验。
147 2
|
10天前
|
Web App开发 人工智能 机器人
牛逼,这款开源聊天应用竟能一键召唤多个AI助手,跨平台通话神器!
`JiwuChat`是一款基于Tauri2和Nuxt3构建的轻量化多平台即时通讯工具,仅约8MB体积却集成了**AI群聊机器人**、**WebRTC音视频通话**、**屏幕共享**等前沿功能。一套代码适配Windows/macOS/Linux/Android/iOS/Web六大平台,堪称开发者学习跨端开发的绝佳样板!
|
8天前
|
人工智能 运维 Serverless
一键轻松打造你的专属AI应用!
函数计算提供免运维、Serverless GPU,具备极致弹性与按量付费优势,助您一键部署AI大模型,加速业务创新。

热门文章

最新文章