国产AI大模型酣战,科大讯飞打响“智慧涌现”第一枪

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: AI大模型技术需求也随之水涨船高,成为科技企业重点关注的方向。

ChatGPT问世半年之久,人与AI“你问我答”的游戏热度不降反升,AI大模型技术需求也随之水涨船高,成为科技企业重点关注的方向。

在海外,OpenAI、谷歌、微软的AI大模型战争正打得火热;在国内,科大讯飞、百度、阿里、腾讯、华为等科技巨头纷纷拥抱AI大模型。它们基于自身智能技术积淀,争先发布AI大模型成果,掀起了一波AI大模型技术浪潮。

5月6日,科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并公布大模型年内三次升级时间点,称10月底将整体赶超ChatGPT,再次引发了国产AI大模型热潮。

**国产AI大模型渐入佳境,实力玩家激战正酣
**
ChatGPT爆火后,国内AI大模型领域按下了“快进键”,科技企业争分夺秒研发AI大模型,国产AI大模型市场呈现多方混战的景象。

一方面,AI大模型是科技企业的“新造梦场”,也是神仙打架现场,没有技术积淀也没有资金实力的玩家终会被淘汰,市场格局将逐渐明朗。

眼下AI大模型创业如火如荼,除了科大讯飞、百度、阿里等知名选手之外,还有一些名不见经传的跨界玩家前来凑热闹。然而AI大模型研发不是简单地堆砌数据、算力和算法,而是复杂的系统性工程,对企业技术能力、资金实力均有高要求,市场混战很快将会过滤掉“噱头玩家”。

另一方面,科技企业的起点不同,竞争分化现象会更明显,随着竞争加剧,“头部阵营”内部也会产生分化,实力更强者将从中脱颖而出。

优胜劣汰的过程没有止境,即便科大讯飞、百度、阿里等具备可研发AI大模型的能力,但企业实力不同,强者与强者之间也要分AI大模型研发速度快慢和产品质量的高低,AI大模型创业浪潮既可卷走弱者,也可锻造强者。

表面来看,科技企业角逐AI大模型是一场“追风行动”,更深层次实则是为了抢夺下一个科技时代的入场券,技术、场景、生态则成为了这场AI大模型竞争制胜的关键。

**技术大比拼
**
众所周知,AI大模型是“大数据+大算力+强算法”结合的产物,科技企业的技术底座决定了其AI大模型的应用价值,因而AI大模型入门资质是科技实力,技术比拼不可避免。

科大讯飞、阿里在AI大模型领域均有深厚技术积累,从各自发布的讯飞星火认知大模型、阿里通义大模型就可窥见其技术功底。

讯飞星火认知大模型在七个维度测评中的表现可圈可点,特别是数学、长文本生成、语义理解等三项能力媲美甚至超过ChatGPT和其他同行。

不仅能回答出“我想把40㎡的房子装修成70㎡的感觉,请给出可行的方案”此类刁钻问题,还能解答算术题“等腰三角形的顶角是底角度数的2倍,请问这个三角形的底角是多少度?”,写散文、写代码、语言翻译都信手拈来。

究其原因,和长期的技术积淀有关,科大讯飞2011 年承建语音及语言信息处理国家工程实验室,2014年开启“讯飞超脑计划”,2017年承建认知智能国家重点实验室,2022年升级“讯飞超脑2030计划”……深耕认知智能领域近十年,在AI大模型所需的数据、算力、算法和模型等方面上已经先行一步。

在数据方面,科大讯飞通过十几年AI技术研发和技术落地推广生涯,积累了超50TB的行业语料和每天超10亿人次用户交互的活跃应用。在算法和模型方面,科大讯飞专研认知智能大模型最核心的Transformer深度神经网络算法,语音识别和图文识别技术全球领先;在算力方面,科大讯飞自建4城7中心深度学习计算平台,为AI大模型构建了坚实的算力底座。

此外,科大讯飞能够屡屡交出让人眼前一亮的答卷,其背后连年剧增的研发投入和超高的研发人员占比起到了关键作用。

据科大讯飞财报数据显示,2022年研发投入为33.6亿元,同比提升14.28%,研发投入占营收的比例为17.83%,较2021年提高1.8个百分点。截至2022年末,科大讯飞研发人员达9281人,占公司总人数比例为61.68%,占比提升3.2个百分点。

无独有偶,阿里的大语言模型“通义千问”,背后的技术积累一样颇为深厚。阿里达摩院在人工智能领域布局多年,形成了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术能力,为阿里AI大模型的训练和运行提供了强大的算力、算法和数据基础。

如此看来,讯飞星火认知大模型、阿里通义大模型皆是多年技术积累的结晶,证明了大模型技术门槛并非普通科技公司可以达到。

**全场景较量
**
技术之外,场景也是AI大模型厂商的重要战场。AI大模型的演进升级需要高质量的内容数据作支撑,而有了丰富的应用场景,大量数据自然会产生,且技术始终要为场景服务,场景的重要性不言而喻。

为了积累更多内容数据,也为了给用户带来全新的体验,AI大模型厂商在探索大模型落地的道路上做了很多尝试,而落地布局逻辑大致上遵循一个思路:从自家主要业务入手,再延伸覆盖千行百业。

科大讯飞星火大模型最先应用于教育、办公、汽车驾驶、数字员工等场景,升级产品智能化功能,极大程度改善了用户体验。

在教育领域,讯飞星火大模型+学习机(科大讯飞AI习机T20),可以AI写作批改、精细批改、给优化参考,俨然成为学生的智能家庭教师。在办公领域,讯飞星火大模型+办公(讯飞听见、讯飞智能办公本X2),可以自动会议纪要、自动语篇规整、一键成稿,是职工的智能办公助理。

在汽车驾驶领域,讯飞星火大模型+智能座舱,可以提供多轮、多人、多区域、多模态智能汽车人机交互范式,强化智能座舱的科技体验感。在数字员工领域,讯飞星火大模型+数字员工,优化了数字员工语音和文本交互体验……

总之,科大讯飞围绕自身业务优势去落地AI大模型技术,不仅对学习机、办公本、智能座舱等智能产品进行全面升级,增强了产品竞争力,还加快了AI大模型规模化落地的效率,达成一个双赢的状态。

同样地,华为专注于“AI赋能产业”,华为盘古系列AI大模型(NLP大模型、CV大模型、科学计算大模型)在远程协作、自动驾驶、智慧城市等多个产业释放AI能力,助力行业降本、增效、提质。

AI大模型技术落地处于初步探索阶段,各大AI大模型厂商正积极抢占“空白场景”,而AI大模型技术发展到一定水平之后,AI大模型也将随之进入应用场景爆发阶段,届时围绕全场景的争夺会越来越激烈。

**生态位争夺
**
随着竞争升维,AI大模型将逐渐由单一的技术与场景之争,转向产业生态的竞争,这就要求科技企业持续完善AI大模型生态。为此,科大讯飞和百度不约而同的选择通过“技术开放”,与数据资源方、场景应用方建立合作关系,打造坚实的生态壁垒。

在内部,科大讯飞基于自身业务资源,加快AI大模型与垂直行业深度融合,丰富AI大模型生态。在外部,科大讯飞携手各大合作伙伴共建、完善和拓宽AI大模型生态圈。

一方面,科大讯飞多元化业务是拓展AI大模型生态的重要资源。科大讯飞的业务广而大,智慧教育、智慧城市、智慧汽车、智慧医疗、智慧金融等垂直领域的硬件产品和APP全面接入AI大模型技术,可提高AI大模型技术的落地效率和效果。

另一方面,科大讯飞持续开放AI大模型技术、连接生态合作伙伴,通过合作的方式快速扩大生态规模,做大做强AI大模型生态。比如,讯飞星火算力硬件主要由华为提供,这两大强者交流合作、经验借鉴,形成良性竞争和互补发展的局面。

据悉,讯飞开放平台新增星火认知大模型,为开发者和合作伙伴提供更具价值的AI应用,首批来自36个行业的3000余家企业开发者将接入星火大模型。此外,目前讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。

和科大讯飞一样,百度坚持技术创新及开放生态,试图通过技术赋能降低AI大模型技术开发和应用的门槛,为各行各业的数智化转型升级打造坚实的技术底座。目前,百度通过飞桨开源开放平台、百度智能云等平台,将文心大模型赋能到多个行业,并且个人、企业开发者数量超6万。

科大讯飞、百度试图通过AI大模型技术输出连接生态伙伴,构建生态壁垒,从而增强企业竞争力,以期在未来竞争中赢得有利位置。接下来,AI大模型厂商竞争的主旋律将是:找准生态位,守住生态位。

**AI星星之火,带动“智慧涌现”燎原之势
**
众所周知,当AI大模型突破某个数据规模时,性能会得到显著提升,进而呈现“智慧涌现”现象。那么,哪些科技企业有望在中国实现智慧涌现?

很明显,从技术、场景、生态等竞争维度来看,最有可能胜出的一类是以科大讯飞为代表的长期深耕AI技术的科技公司;另一类是以阿里、华为、百度等资金实力雄厚的互联网公司。

首先,这些玩家推动AI大模型深入应用于千行百业,将创造更多智慧涌现的机会。例如,科大讯飞继续推动“1+N”认知大模型专项攻关,为各行各业AI大模型技术赋能,会面临很多新挑战以及新机遇,而攻克落地难关的过程,充满智慧涌现的机会。

其次,算力、算法、数据等基础支撑能力越来越强,将大大提升AI大模型升级迭代速度,点亮智慧涌现曙光。数字经济高速发展,基础设施建设不断完善,将提高算力供给能力,驱动AI大模型汲取更多数据反复试验和学习,最终将实现算力、算法和数据规模的突破。

最后,科技巨头们的激烈博弈,无疑将进一步推动AI大模型生态的发展,加速“智慧涌现”时代的到来。

目录
相关文章
|
26天前
|
人工智能 并行计算 安全
从零到一,打造专属AI王国!大模型私有化部署全攻略,手把手教你搭建、优化与安全设置
【10月更文挑战第24天】本文详细介绍从零开始的大模型私有化部署流程,涵盖需求分析、环境搭建、模型准备、模型部署、性能优化和安全设置六个关键步骤,并提供相应的示例代码,确保企业能够高效、安全地将大型AI模型部署在本地或私有云上。
245 7
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
13天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
57 3
|
22天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
91 2
|
15天前
|
人工智能 弹性计算 Serverless
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
本文介绍了零售业中“人—货—场”三要素的变化,指出传统营销方式已难以吸引消费者。现代消费者更注重个性化体验,因此需要提供超出预期的内容。文章还介绍了阿里云基于函数计算的AI大模型,特别是Stable Diffusion WebUI,帮助非专业人士轻松制作高质量的促销海报。通过详细的部署步骤和实践经验,展示了该方案在实际生产环境中的应用价值。
48 6
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
|
26天前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
12天前
|
人工智能 新制造 芯片
2024年中国AI大模型产业发展报告解读
2024年,中国AI大模型产业迎来蓬勃发展,成为科技和经济增长的新引擎。本文解读《2024年中国AI大模型产业发展报告》,探讨产业发展背景、现状、挑战与未来趋势。技术进步显著,应用广泛,但算力瓶颈、资源消耗和训练数据不足仍是主要挑战。未来,云侧与端侧模型分化、通用与专用模型并存、大模型开源和芯片技术升级将是主要发展方向。
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
【10月更文挑战第31天】2024年,AI大模型在软件开发领域的应用取得了显著进展,从自动化代码生成、智能代码审查到智能化测试,极大地提升了开发效率和代码质量。然而,技术挑战、伦理与安全问题以及模型可解释性仍是亟待解决的关键问题。开发者需不断学习和适应,以充分利用AI的优势。
|
20天前
|
人工智能 JSON 自然语言处理
基于文档智能&RAG搭建更懂业务的AI大模型
本文介绍了一种结合文档智能和检索增强生成(RAG)技术,构建强大LLM知识库的方法。通过清洗文档内容、向量化处理和特定Prompt,提供足够的上下文信息,实现对企业级文档的智能问答。文档智能(Document Mind)能够高效解析多种文档格式,确保语义的连贯性和准确性。整个部署过程简单快捷,适合处理复杂的企业文档,提升信息提取和利用效率。
|
16天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
73 4

热门文章

最新文章

下一篇
无影云桌面