大模型应用疯狂加速,洗牌却在静悄悄进行了

简介: 随着未来不断有新的企业通过备案,“大模型+”的应用拐点正在到来。

在被誉为“科技企业营销圣经”的《跨越鸿沟》一书中,杰弗里·摩尔写道:“高科技产品面世过程中,最危险、最关键的一点,就是由少数有远见者所主宰的早期市场,向实用主义者占支配地位的主流市场过渡。”此刻,狂飙突进已半年有余的国内生成式人工智能(AIGC)市场,正面临着这个关键的过渡。

截至8月底,首批8家AI大模型企业通过备案。与上半年“甚嚣尘上”的行业境况不同,具备实力且具备满腔“产业抱负”的实力型玩家,总是姗姗来迟,但却总是能够一鸣惊人,为产业的大规模应用创造机会。目前来看,随着未来不断有新的企业通过备案,“大模型+”的应用拐点正在到来。

“大模型+”应用拐点加速到来

8月份刚刚过去,9月初百度就迫不及待地对外公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来,正推动整个“大模型+”应用时代加速到来。

首先,大模型从C端应用逐渐转向B端应用领域,以“实用”为导向的大模型日渐成为行业趋势。自从去年12月ChatGPT,在短短一个月之内实现月活破亿之后,围绕整个C端市场的AI大模型玩家如百度等,就开始大规模地涌入该领域,一时之间C端大模型应用迎来了外界的一致关注。但进入下半年以后,市面上越来越多的“面向B端”的应用开始出现,更加“实用”的行业大模型也在成群结队地出现,大大加速了生成式AI产业化的进程。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型,用友发布了用友GPT大模型等等。

相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。以网易有道、京东两家为例,网易有道在教育领域深耕已久,它在长期深耕行业的过程中,不仅积累了庞大的用户和教育行业数据,还积累了相对应的高质量数据,这使其在做教育大模型过程中,拥有更多比较优势。无独有偶,京东在零售、大健康领域广有布局,这使其在构建产业大模型和京医大模型方面,拥有坚实根基;而携程则在文旅行业深耕已久,积累了广泛的文旅产业链数据和资源。

显然,相比通用大模型厂商而言,围绕垂直领域的行业大模型,不仅可以依靠专业数据让大模型更加“实用”,还可以在特定领域发挥独特作用,帮助行业尽快完成数字化转型。

其次,具备通用能力的大型云服务企业,正在加速与各路行业大模型企业展开合作,新的大模型生产机制正在成型。目前业内包括百度、腾讯、阿里、华为等主要云厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现抢跑。除此之外,各主要厂商还联合行业头部企业,推出行业大模型解决方案。

比如,腾讯云联合行业头部企业,已为文旅、政务、金融等10余个行业,提供了50多个大模型行业解决方案。华为旗下盘古大模型,更是可以提供5个基础大模型+N个行业大模型+X个场景模型的三层解耦架构,目前已经应用到了铁路、矿山、能源、气象、政务等诸多领域。阿里云更是对外开放了“通义千问”的全部能力,帮助企业结合自身的行业知识和应用场景,训练自己的企业大模型;加上目前已经开源的文心一言,由大的云平台提供包括云服务、算力、通用大模型工具支持等基础设施,各行业头部企业提供专业经验和数据训练的大模型生产机制已经基本成型。

志在必得的腾讯

对于大模型的发展,腾讯高层显然很早之前就已经定下了调子,但其推出的时间却在一众巨头中最晚。在上半年如火如荼的大模型混战中,腾讯的大模型在业内一直是“只闻其声、不见其名”的存在。但从9月其正式面世之后的外界反应来看,此前“默默无闻”的腾讯大模型,更多是在“厚积薄发”。

9月7日腾讯正式对外发布了腾讯混元大模型,据了解该模型拥有超千亿参数规模,预训练语料超过2万亿Tokens,并已接入腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等50多个腾讯业务。而且在国家公布的首批大模型厂商中,腾讯混元大模型赫然在列。同时,腾讯混元大模型还宣布对外开放,千行百业的人都可以通过API调用混元,或者将其作为产业底座,为不同产业场景构建大模型应用,不难看出腾讯对大模型的“志在必得”。

首先,腾讯构建了“更强”的“探真”技术方法,这使其具备更强的信息可信度,极大增强了大模型自身的实用性。基于全网的数据检索和生成,是大模型的核心能力之一。值得一提的是,无论是基于GPT-3.5还是国内其他大模型,源于错误信息带来的错误答案,依然不可避免。但腾讯混元大模型却基于自身的技术能力,保证正确答案的输出。

与业界消除“幻觉”的通用做法不同,混元大模型并没有为大模型增加搜索或者知识图谱等外挂,而是从源头上解决问题。具体来说,混元大模型从第一行代码开始,就采用了预训练阶段优化目标函数的“探真”技术方法。据业内专业人士介绍,该方法与常见的开源大模型相比,能有效降低幻觉30%到50%。

除了“探真”能力优秀之外,腾讯混元的另一大超强能力在于其支持超长文本输出。尽管目前多模态正在成为主流大模型演进方向,但在文本输出方面,包括GPT-3.5和GPT-4在内的大模型,都很难支持1000字以上的文本输出,但腾讯混元通过位置编码优化提高了超长文的处理效果和性能,已经具备输出4000多字的完整答案的能力。

其次,腾讯构建了从软到硬的全流程基础设施,这让腾讯具备了更强的“全局优化”能力。从自研的星星海服务器,到新一代HCC高性能计算集群,再到自研的星脉高速网络,腾讯已经为自己打造了一整套面向AIGC的高性能智算网络。据腾讯内部负责人介绍,目前腾讯云已经可支持超过10万张卡并行计算的大规模训练集群,万亿参数大模型可以在四天之内完成。

目前,腾讯云已经建立起了围绕大模型的全套能力,包括高性能算力集群、云原生数据湖仓和向量数据库等数据处理引擎,以及模型安全、支持模型训练和精调的工具链等,企业和开发者都可以根据自己的需求,灵活选择产品,降低大模型的训练成本。

不甘落后的科大讯飞

除了腾讯大模型之外,在大模型上已经先行一步的科大讯飞也是不甘落后,不仅积极参与通用大模型的建设,还持续发力行业大模型的建设。目前科大讯飞的大模型已经具备7大能力,分别为:文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力,并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量,科大讯飞也做了多方面的准备。

一方面,科大讯飞积极展开与业内巨头的合作,强化星火大模型的技术实力。早在今年8月中旬,科大讯飞就与华为共同发布星火一体机,让所有企业都可以在国产自主创新平台上私有化部署大模型。一来,星火一体机基于星火认知大模型,针对污语料和幻觉问题,形成了“立体化”的内容安全机制。二来,星火一体机基于昇腾AI硬件、昇思AI开源框架,提供业界领先的大模型训练、推理能力,为大模型全流程创新提供坚实的自主创新算力底座。

具体来说,讯飞星火认知大模型基于训练推理一体化设计,实现大模型稀疏化、低精度量化的技术突破,能高效适配昇腾AI,加速大模型的行业落地应用和迭代;与此同时,以昇腾AI为核心,软硬件协同优化,构建算力集中、协同优化、供给稳定、数据安全的大模型训练集群,这些都可以强化星火大模型的自身实力。

另一方面,科大讯飞积极推动与自身业务场景的整合,加速大模型的场景落地。除了不断强化自己核心能力之外,科大讯飞还结合自身的业务场景,推动大模型在办公、政务、电力、教育、医疗、工业、司法、金融等行业的场景落地。星火一体机内已涵盖办公、代码、运维、客服、营销、采购等10多个场景包,支持对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,并将持续拓展更多专业场景和模式优化,为客户快速定制企业专属大模型。

总的来看,科大讯飞在大模型上,外部合作和内部场景落地相结合的方式,很好地保证了其大模型产业化的加速落地。

大模型大洗牌正在加速到来

在众多头部巨头和行业巨头的共同努力之下,“百模大战”甚至“千模大战”的局面正在加速形成。而在这种的形势之下,围绕大模型的“行业大洗牌”或将提前到来。

首先,产品能力的比拼已经初见分晓。据知名厂商IDC依据算法模型、通用能力、创新能力、平台能力和安全可解释等五方面的要求,评估出了目前市面上在大模型方面综合评分最高的三家厂商,分别是百度、阿里巴巴、科大讯飞。不过由于这个数据排出的时间较早,未考虑到腾讯和华为的产品能力,所谓真实的综合技术实力方面,排名靠前的依旧会是BATH这些行业巨头。

但各家的能力并不相同,也各有侧重。具体来说,百度的能力在于其具有“芯片—框架—模型—应用”四层技术栈完整布局的独特优势:芯片层—昆仑芯、框架层—飞浆、模型层—文心大模型,以及各种AI的落地应用。阿里的能力也相近,其强大之处在于围绕云搭建起了一整个的大模型基础设施;华为的能力在于强大的基础技术能力,以及广泛的终端生态应用和B端应用能力。在BATH之外,其他大模型厂商依然排在第二梯队、第三梯队,产品层面的分化已经出现。

其次,是大模型生态服务能力的比拼已然拉开序幕。以阿里为例,阿里不仅推出了通义千问大模型,还推出了魔搭大模型社区,还有众多的生态合作伙伴;百度在这方面也不遑多让,不仅有基于大模型的技术能力,还有广泛的生态伙伴,推理能力和速度伴随着大模型的版本更新,也在日新月异;作为同级别大厂,华为、腾讯等厂商自然也具备类似能力。不难预见,未来各路厂商围绕预训练、逻辑推理等相关方面的技术服务,将成为行业竞争的常态。

当然,无论是产品维度还是服务能力,最终都要落地到产业实践上。从行业覆盖来看,从文心大模型出发,百度已经在能源、汽车、政务、交通、金融等重点领域布局11个行业大模型,将大模型融入到垂直领域,真正做到产业实践和商业落地。阿里、腾讯、华为等也覆盖电商零售、物流、社交、矿业等诸多行业,产业化落地也在快速提升。

而随着各大平台的大模型,在产品、生态服务和产业实践上的全面展开,大模型的大洗牌正在加速到来。

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 边缘计算
大模型在医疗领域的应用
🌟蒋星熠Jaxonic,AI开发者,深耕医疗大模型领域。见证代码如何重塑医疗:从影像分析到智能诊断,从药物研发到临床决策。分享技术实践与行业洞察,探索AI赋能健康的时代变革。
大模型在医疗领域的应用
|
1月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
2月前
|
人工智能 自然语言处理 搜索推荐
携多项成果亮相云栖大会,探索大模型在云通信中的创新应用与全球实践
2025云栖大会云通信分论坛聚焦大模型与云通信融合,阿里云发布智能联络中心2.0与Chat App AI助理,携手伙伴推动通信智能化升级。
296 1
|
4月前
|
人工智能 自然语言处理 开发工具
统一多模态 Transformer 架构在跨模态表示学习中的应用与优化
本文介绍统一多模态 Transformer(UMT)在跨模态表示学习中的应用与优化,涵盖模型架构、实现细节与实验效果,探讨其在图文检索、图像生成等任务中的卓越性能。
统一多模态 Transformer 架构在跨模态表示学习中的应用与优化
|
4月前
|
人工智能 自然语言处理 搜索推荐
企业客户服务效率低、体验差,如何通过大模型技术改善?一文了解面向客户服务全场景的行业大模型的3大应用方向
本文三桥君探讨了大模型技术在客户服务领域的应用与实践。从架构设计出发,详细解析了面向客户、客服和运营三大场景的智能功能模块,包括业务咨询、情感关怀、智能点选、知识采编等12项核心功能。AI产品专家三桥君指出,通过行业大模型定制、多源数据整合等技术手段,企业可实现客户服务的智能化升级,显著提升客户体验和运营效率。
313 0
|
5月前
|
传感器 人工智能 监控
通义灵码智能体模式在企业级开发中的应用:以云效DevOps自动化流程为例
通义灵码智能体模式具备语义理解、任务闭环与环境感知能力,结合云效DevOps实现CI/CD异常修复、测试覆盖与配置合规检查,大幅提升研发效率与质量。
258 0
|
2月前
|
人工智能 Java API
Java与大模型集成实战:构建智能Java应用的新范式
随着大型语言模型(LLM)的API化,将其强大的自然语言处理能力集成到现有Java应用中已成为提升应用智能水平的关键路径。本文旨在为Java开发者提供一份实用的集成指南。我们将深入探讨如何使用Spring Boot 3框架,通过HTTP客户端与OpenAI GPT(或兼容API)进行高效、安全的交互。内容涵盖项目依赖配置、异步非阻塞的API调用、请求与响应的结构化处理、异常管理以及一些面向生产环境的最佳实践,并附带完整的代码示例,助您快速将AI能力融入Java生态。
474 12
|
2月前
|
人工智能 自然语言处理 算法
现代AI工具深度解析:从GPT到多模态的技术革命与实战应用
蒋星熠Jaxonic,AI技术探索者,深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略,助力开发者提升效率,共赴智能编程新纪元。
|
2月前
|
人工智能 算法 数据挖掘
AI Agent工作流实用手册:5种常见模式的实现与应用,助力生产环境稳定性
本文介绍了五种AI Agent结构化工作流模式,帮助解决传统提示词方式在生产环境中输出不稳定、质量不可控的问题。通过串行链式处理、智能路由、并行处理、编排器-工作器架构和评估器-优化器循环,可提升任务执行效率、资源利用和输出质量,适用于复杂、高要求的AI应用。
628 0
AI Agent工作流实用手册:5种常见模式的实现与应用,助力生产环境稳定性

热门文章

最新文章