AI大模型,智能汽车的下一个战场?

简介: AI大模型,智能汽车的下一个战场?

ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面。前两个月,百度、阿里、腾讯加入;进入5月份,先有网易有道,发布了基于“子曰”大模型开发的AI口语老师剧透视频,介绍其基于教育场景的类ChatGPT产品;后有科大讯飞,发布认知大模型“讯飞星火”……总之,各种大大小小的发布会,都在向外界证明自己到底有多大的想象空间。

在大模型进展如火如荼之下,其产业化也被越来越多地提及,从前炒作的“AI+”也再次站上风口。在此背景下,关于AI大模型在汽车领域的应用,也开始热度飙升。

智能汽车的“ChatGPT时刻”来了

目前来看,大模型重构各行各业虽然已经成为业界共识,但ChatGPT“上车”远比预想中的来得更快。作为继家庭和办公场所之外的“第三空间”,汽车正在变成一个新型智能终端。ChatGPT到来了之后,车机关系也受到了更多的影响。

一是ChatGPT对汽车自动驾驶的影响。业内人士分析表示,大模型具备对海量数据的处理能力以及多维度分析能力,可以提供更精准、更全面的数据分析和预测能力,持续优化模型,提高智能驾驶的准确性和可靠性。尤其是随着ChatGPT的出现,人们发现当模型的参数量,达到了一定程度之后,呈现出的效果不是“性能变好”,而是“出奇的好”。

具体到应用层面,大模型对自动驾驶的影响是:在云端,车企可以发挥模型参数量的大容量优势,通过大模型完成绝大多数的数据标注和数据挖掘工作,节省数据标注成本,还能够借助仿真场景构建赋能。在车端,它可以将分管不同子任务的小模型合并为一个大模型,节省车端推理计算时间,增加汽车安全性。最重要的是,被认为是自动驾驶算法终局的端到端感知决策一体化算法瓶颈,或许在汽车接入大模型之后可以得到有效解决,自动驾驶算法升级指日可待。

二是对汽车智能座舱的影响。车载ChatGPT语音助手,可以处理完整的对话,比如追问,并能保持对前后文的理解,形成较为良好的语音交互体验。比如,微软与梅赛德斯—奔驰探索ChatGPT的插件生态系统,为第三方服务集成开辟可能性。驾驶员未来有望通过车载系统完成预订餐厅、预订电影票等任务,进一步提升便利性和生产力,极大地丰富智能汽车与人之间的交互体验。

另外,在改变智能驾驶和智能座舱交互能力的情况下,其也对汽车的研发方式和商业模式产生全新的影响。研发方式方面,由于机器的高效标注能力,使得需要一年时间的数据标注任务,现在只需要短短数小时,研发周期大幅缩短,而且多模态(视觉、语音、手势等)的丰富数据,更可以进一步提升总体的研发效能,降低研发成本。就商业模式而言,车载AI语音交互在它具备情感智能之后,它就会从“雇佣关系”演变成“陪伴关系”,对人的喜好和习惯会更加了解,这将会衍生出全新的商业价值。

产业探索流派纷呈

或许正是意识到了这一点,现在正有越来越多的车企选择接入AI大模型。除了国外的奔驰宣布ChatGPT之外,国内理想汽车也发布了自研大模型MindGPT,百度的文心一言也被接入到了长安、吉利、岚图、红旗、零跑等众多车企之中,就连“让梦想窒息”的法拉利未来,也在新车中纳入了大模型,不难预见未来大模型在智能汽车中普及,将会是大概率事件。从整个参与的车企来看,其发展大模型的方向和侧重点并不相同。

从功能上来看其主要可以分为以下两类:一类是用于人工智能交流对话领域,多数应用在智能座舱上。比如,百度的文心一言,目前已经有东风日产、红旗、长城等近十家车企宣布接入;上海车展期间,商汤科技亮相了日日新Sensenova大模型,展示了其中文语言模型“商量SenseChat”以及“如影SenseAvatar”等与座舱的结合;此前阿里巴巴也宣布AliOS智能汽车操作系统,已接入通义千问大模型进行测试等。

另一类是聚焦智能驾驶的大模型应用。比如毫末智行发布了自动驾驶生成式大模型DriveGPT,帮助解决认知决策问题,最终实现端到端的自动驾驶。理想汽车自研大模型MindGPT,摆脱对高清地图的依赖,让汽车做到更接近人类司机的驾驶表现。蔚来、小鹏、长城、奇瑞四家车企,也已经注册申请了多个与GPT相关的商标。

从参与主体来看,也主要可以分为两类:一是车企亲自下场做的,如理想汽车、百度将自家大模型应用于自家汽车产品等;另一类是外部厂商提供大模型给车企,比如华为盘古大模型、百度文心一言等用于给其他车企使用。

相较通用大模型来说,垂直领域的大模型训练和使用成本更低,或许会成为更容易实现商业化落地的领域。业内人士分析称,汽车有着明确的交互需求,且相较于通用大模型,垂直领域的应用场景相对较小,对参数的量级要求也没有通用型AI那么大。因此,无论是传统车厂还是新势力,抑或是大模型科技厂商,普遍认为智能汽车最有可能成为率先实现大模型落地的B端场景。

大模型规模上车时机尚未成熟

目前来看,尽管ChatGPT的首发“上车”,已经拉开了智能汽车领域大模型较量的序幕。但现阶段距离大模型的真正规模上车,也还有一段距离。

首先,车企做大模型,多模态数据的收集、处理、训练本身是一个难题。自动驾驶所需传感器数据包括激光雷达、毫米波雷达、超声波雷达,以及高清摄像头、GPS等。这些数据来自不同的坐标系,带有不同的触发时间戳,且要考虑到硬件损坏等问题;同时,需要大量的场景数据,比如交通标志线、交通流、行为模型等。这让汽车大模型的研发、训练门槛变得很高。

业内人士认为,模型数据调动管理需要利用智能网联汽车以及计算技术平台、云控技术平台等诸多平台,只有做到海量数据汇聚才可以做交叉,尤其是垂直领域,这和车内的其他系统并不相同,假如基础的平台能力不能打通,其很难向更深层次发展。另外,尽管生成式AI在信息获取上获得了突破,但在决策、执行控制层面,其离真正在汽车上落地还有较大的距离。

另外,端到端的AI大模型训练,需要在智能汽车中构建全新的基于AI大模型的全新算法,这也需要一个过程,业内人士认为至少需要3—5年甚至更长的时间,来完成这一过程。

其次,受限于车载设备的硬件条件,汽车内大模型所需要的硬件配置可能会受到限制,难以有效发挥好作用。具体来说,大模型需要高规格的硬件配置,包括高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的算力资源支撑大模型运行。比如,在自然语言处理领域的GPT-3模型,就需要数万亿TOPS的计算能力。这要求芯片的算力至少要在万级TOPS以上,才能够胜任大模型的计算任务。但是在车载部署场景下,芯片的算力往往只有数百TOPS,远远达不到大型模型的要求。

在此背景下,升级汽车内的算力基础设施已成必然趋势,目前来看智算中心或许会成为未来智能汽车的“标配”。比如,特斯拉发布了独立的云端智算中心——Dojo,总计使用了1.4万个英伟达的GPU来训练AI模型。在国内,小鹏汽车与阿里云合建了智算中心“扶摇”,专门用于自动驾驶模型训练,算力可达到600PFLOPS;毫末智行与火山引擎联合打造了国内自动驾驶行业最大的智算中心“雪湖.绿洲”,每秒浮点运算可达到67亿亿次。不过,目前这些建设还处于探索应用阶段,大模型应用大规模上车的时机,还没有完全成熟。

底层技术才是未来角逐焦点

目前来看,AI大模型对汽车最本质的改变,可能在于它将进一步驱动汽车,从制造属性向科技+消费电子属性转变。在这种背景下,车厂本身的底层科技能力,将会成为未来的决胜关键。

一方面,AI大模型会重新定义“人机交互”和“服务生态”,加速汽车应用服务生态消费电子化,这将改变底层的产品定义。当前车载语音系统底层是未完全成熟的任务型对话系统,尚无法真正实现个性化、情感化、自由化的交互能力,而大模型可以通过深度学习+语音生成,迎来开放场景+自然交互的全新人机交互体验。同时,在研发设计上,随着大模型的OS化,传统的APP上车、点触功能、HMI交付的必要性和重要性值得思考,这意味着汽车“产品”的重新定义。

正如前华为自动驾驶产品部部长苏箐所言:“传统车厂看法首先我的基座是车,现在有些计算机的单点,那么我是把车作为一个基础,试图把计算机嵌进去,这是传统车厂的看法。我们的看法不一样,基础是计算机,车是计算机控制的外设,一个大计算机了事,把车挂上去。这是本质看法不一样。”事实上,在大模型上车之后,汽车的计算中心、智能化、消费电子属性将变得更加明显,其产品定义将遵循消费电子的底层逻辑迭代演变(如APP化、生态服务等)。

另一方面,AI大模型将会改变汽车的现有算法,考虑到大模型应用所需要的硬件成本以及外部环境来看,未来国内企业大模型的技术实力,将更加取决于包括AI操作系统等在内的底层技术。具体来说,原来汽车的自动驾驶算法较为依赖人工,而接入大模型之后,就需要依靠大模型驱动形成新的智能算法,而要构筑这样的算法,除了要做好产品,还要做好平台。

比如,围绕芯片、云端等在内的计算平台,需要做到低成本、可标配;有了好的产品,才能够有足够多的销量,有足够多的销量,才能增加“端到端”(云端到车端)的闭环数据;作为基础支撑的AI大算力芯片,也需要重新考虑车企自身的情况来做,回到底层来说就是谁的训练成本低,谁的转化速度快,谁就将跑到最前面。

拿英伟达的训练芯片来说,一枚芯片被炒到了10万块钱,关键是这种高成本芯片训练方案,对于车企并非最优解决办法。而且受外部制裁影响,这种“外供依赖”随时有可能被掐掉,脆弱性很大。因而从长远来看,车企想要在这一领域走到行业前列去,要么加大对底层芯片的自研力度以减少采购成本,如百度自研AI芯片,要么在AI算法、操作系统上去寻求破局,以找到最佳的应用路径。

目录
相关文章
|
7天前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
18天前
|
人工智能 缓存 监控
使用LangChain4j构建Java AI智能体:让大模型学会使用工具
AI智能体是大模型技术的重要演进方向,它使模型能够主动使用工具、与环境交互,以完成复杂任务。本文详细介绍如何在Java应用中,借助LangChain4j框架构建一个具备工具使用能力的AI智能体。我们将创建一个能够进行数学计算和实时信息查询的智能体,涵盖工具定义、智能体组装、记忆管理以及Spring Boot集成等关键步骤,并展示如何通过简单的对话界面与智能体交互。
444 1
|
18天前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
681 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
8天前
|
人工智能 小程序 Java
电子班牌管理系统源代码,基于AI人脸识别技术的智能电子班牌云平台解决方案
电子班牌管理系统源码,基于AI人脸识别的智慧校园云平台,支持SaaS架构,涵盖管理端、小程序与安卓班牌端。集成考勤、课表、通知、门禁等功能,提供多模式展示与教务联动,助力校园智能化管理。
61 0
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
248 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
12天前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
|
7天前
|
传感器 人工智能 机器人
科技云报到:找到真场景,抓住真需求,这样的具身智能才是好AI
科技云报到:找到真场景,抓住真需求,这样的具身智能才是好AI
|
9天前
|
人工智能 Java 物联网
Java与边缘AI:构建离线智能的物联网与移动应用
随着边缘计算和终端设备算力的飞速发展,AI推理正从云端向边缘端迁移。本文深入探讨如何在资源受限的边缘设备上使用Java构建离线智能应用,涵盖从模型优化、推理加速到资源管理的全流程。我们将完整展示在Android设备、嵌入式系统和IoT网关中部署轻量级AI模型的技术方案,为构建真正实时、隐私安全的边缘智能应用提供完整实践指南。
152 3
|
10天前
|
人工智能 监控 Java
Java与AI智能体:构建自主决策与工具调用的智能系统
随着AI智能体技术的快速发展,构建能够自主理解任务、制定计划并执行复杂操作的智能系统已成为新的技术前沿。本文深入探讨如何在Java生态中构建具备工具调用、记忆管理和自主决策能力的AI智能体系统。我们将完整展示从智能体架构设计、工具生态系统、记忆机制到多智能体协作的全流程,为Java开发者提供构建下一代自主智能系统的完整技术方案。
137 4

热门文章

最新文章