科技云报道:国内AI大模型鏖战,上演科技罗生门

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 四大派系初现

科技云报道原创。

ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者、投资人以及企业可以说有过之无不及。
于是,这些投资人、从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产品。一时间,大模型赛道好不热闹。

毫不夸张地说,从3月份至今,国内几乎每一周都有企业推出自己的大模型产品。上一周,科大讯飞公布了星火认知大模型后不久,云从科技就被爆出即将在5月18日发布大模型产品。

随着大模型产品的推出,其背后公司股价也是一路飘红。更为奇幻的一幕出现了,只要是沾上了大模型的边,公司股价就会蹭蹭上涨。

拿云从科技来说,尽管只是放出了产品发布的消息,云从科技近几天的股价也是一路向红。此前,在概念股疯长的阶段,得益于其AI相关业务属性,云从科技的股价早已经历经过一轮上涨,股价从26元每股涨至61.8元每股。

这又燃起了更多人对大模型的向往。周而复始间,国内大模型可以说是“百家争鸣”。但问题紧跟着出现,这些企业或者是人做入局大模型的原因何在?是与公司业务紧密相关,还是个人追求,又或是单纯的蹭热度?

另外,在大模型遍地开花的现在,又有哪些企业真正做到了场景落地,又有哪些是严重同质化,会被轻易取代?
国内大模型市场,俨然像是开启了一场科技盛宴,但其中鱼龙混杂的参会人员,让这场盛宴变得更为扑所迷离。

四大派系

三月份以来,两个时间节点可以说是让媒体人刻骨铭心。

一个是三月的第三周。那一周,周二深夜,ChatGPT4发布。周四下午,百度文心一言发布。紧接着凌晨时分,微软宣布将ChatGPT能力接入Office全家桶。

另外一个是4月18日,这一天,6个关于大模型的重要消息密集发布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…

“键盘敲到要冒烟”可以算是当时媒体人的真实写照。不过,尽管写稿写到绝望,依旧掩盖不住地兴奋之情。
可以说,媒体人的状态侧面显露了当时的盛况。

据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。当然,除了这超40家的企业、机构之外,还有不少企业和互联网大佬都透露出自己正在做大模型相关的产品的消息。

为了更好的分析企业的出发点、优劣势,我们从企业的性质出发,将这些已经或者入局在做大模型产品的企业和人分为这四大派系:互联网科技大厂以及科研机构、初创公司以及互联网大佬、AI企业(包括上市公司和创业独角兽)、跨界企业。

派系一:互联网科技大厂以及科研院所

互联网科技大厂和科研院所可以算是国内AI大模型领域的领头羊。这些大厂和机构拥有强大的技术实力和庞大的数据资源,同时互联网科技大厂还可以通过其它业务实现AI大模型的商业化应用。

比较典型的就是,百度有文心大模型以及文心一言;阿里有通义大模型和通义千问;腾讯有混元大模型和混元助手;华为有盘古大模型;字节跳动有飞书“My AI”;京东有ChatJD;360有360智脑;科大讯飞有讯飞星火等。

另外,科研院所的代表则是复旦大学邱锡鹏教授团队的对话式大语言模型MOSS、上海人工智能实验室的天气预报大模型“风乌”、清华大学的GLM-130B、北京智源人工智能研究院“悟道2.0”等等。

值得注意的是,这些互联网大厂的大部分模型已经开放了内测名额,普通受众也可以通过报名的方式体验大模型。
派系二:AI企业(上市公司和创业独角兽)

AI企业是中国AI大模型领域的另一个重要力量。这些企业在技术创新和商业模式上具有很强的专业性和深度,同时也可以通过资本市场的支持来加速其业务拓展。例如,旷视科技、商汤科技、云从科技等企业在图像识别、人脸识别等领域中均表现不俗。

具体来说,商汤科技发布了日日新SenseNova和商量、毫末智行发布了自动驾驶生成式大模型DriveGPT、竹简智能发布了魔力写作等等。

值得注意的是,目前AI企业推出的大模型更多是面向B端,因此大部分并未开放给普通用户测试。

派系三:初创公司以及互联网大佬

初创公司和互联网大佬是中国AI大模型领域的另一个重要力量。但目前,宣布入局大模型的互联网大佬还并未推出具体的产品。不过,凭借着其互联网老兵的身份以及技术实力等,他们依旧可以拿到天使轮融资,并且吸引很多人才。

王小川和王慧文即是如此。有意思的是,王小川为了宣布入局大模型一事,在搜狐大厦召开了媒体发布会,而楼上,就是王慧文做大模型的办公地点。

另外,有一个不得不说的前提,这些互联网老兵拿到的第一笔钱即5000万美金。此后,5000万美金也成了入局大模型的一道门槛。

派系四:跨界企业

从其他领域跨界的企业是中国AI大模型领域的一大特点。这些企业在自身领域内拥有丰富的数据资源和技术经验,通过AI大模型技术的运用,可以实现多个领域之间的交叉应用。例如,教育行业的学而思发布了MathGPT,专攻数学大模型,主要就是与其教学业务相结合。

为什么要做大模型?

梳理完企业后,不得不抛出一个问题,为什么要做大模型?

笼统来说,无外乎有下述几点原因:大模型可以为企业带来很多商业机会和收益,AI大模型是当前AI技术发展的重要方向之一,各个企业加入到竞争中也符合市场趋势和国家发展需求。

不过,具体来看,这四大派系的做大模型的原因、以及目的还是有所不同。

派系一:互联网科技大厂和科研院所

科研院所不必多说,学术研究使然,重点在于互联网科技大厂。

首先是,互联网科技大厂必须要做大模型。

就百度来说,从2017年李彦宏提出All in AI后,百度的业务巨轮从此前的搜索引擎和互联网业务转向了AI技术落地自动驾驶、智能云。尽管如此,在商业化落地上,AI目前仍未能取得突破性进展。从百度2022年年报来看,百度的收入基本盘依旧是以广告为主的互联网业务收入。

百度不得不去做大模型,争分夺秒去推文心一言。当然,百度也有能力去做文心一言。百度在AI领域的积累——海量数据、算力、算法以及预训练大模型,已经具备了生成类似项目的条件。

百度做的目的,已经逐渐显露出来——与自身业务结合,寻求技术落地,实现商业化。如与搜索引擎结合,或许会带来互联网广告收入形式的革新,以及出现新形式的增值服务,有不小的想象空间。

此外,百度还发公告称,小度将融合文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」,应用到小度全系产品。更为重要的是,百度另一大业务,智能汽车中的车载场景同样如此。

阿里、腾讯、甚至京东等大厂都可以以此类推。

总结来说,互联网科技大厂拥有丰富的数据资源和高算力支持,这也为它们在AI大模型领域拥有独特的优势。在AI大模型的研发和应用中,大数据和算力是至关重要的,而互联网科技大厂在这方面已经具备了很高的技术实力和经验积累。同样,他们拥有广泛的业务场景,可以在技术支持下实现场景的落地。

派系二:AI企业(上市公司和创业独角兽)

AI技术的专业公司,这些企业在AI大模型领域拥有很强的技术实力和经验积累。

毫末智行官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。这不得不引人发文,自动驾驶也需要GPT么?实际上,自动驾驶进入3.0时代后,不再是硬件或者软件驱动,不再是测试道路下的数据驱动,而是以真实道路行驶场景为核心的数据驱动。AI依然是核心技术,与1.0、2.0时代不同就在于AI对数据的要求发生了质变,“大模型”成为新的技术基石。

派系三:初创公司以及互联网大佬

初创公司通常具有较为灵活的运营模式和创新思维,更容易迅速适应市场需求并开展相应的业务。在AI大模型领域,初创公司可以通过创新的技术和业务模式来获取商业机会。

王小川在入局大模型赛道后,就一直强调未来发力的方向并不是像OpenAI一样去做AGI(通用人工智能),而是垂直在某些特定的领域去做大模型,并实现落地应用。

派系四:跨界企业

跨界企业不用多说的是,会与自身业务相结合,比如说垂直到教育、医疗、金融、房地产等领域。

不过,需要警惕的是,不少跨界的企业大有蹭热度,拉高股价的嫌疑。毕竟,能够做出真正实用的大模型离不开高额的投入、精进的算法、海量数据等。

泡沫横生,再现罗生门

大模型火热,正面展现了国内的科技热情,阴面却是泡沫横生。

在ChatGPT出现后,国内最开始传出入局大模型的企业,其实只有互联网科技大厂和AI企业。毕竟,这些企业有着AI背景,要么有数据、要么有算法、要么有资金投入或者是人才投入。

但是随着ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座后,不少其他赛道的企业,或者是靠近AI边缘业务的企业也纷纷下场,去推出大模型产品或者是透露出做大模型的战略规划。

但这无疑主动放大了市场需求,打乱了市场发展节奏。最明显的表现,除了企业纷纷下场去做大模型外,还间接拉动了相关产业链的需求。

AI大模型作为一项前沿技术,其产业链包括了算力、数据、算法等多个环节。在这些环节中,算力和数据是AI大模型发展的关键。

当前,国内算力和数据产业的发展已经进入到一个快速发展的阶段。云计算、大数据、物联网等技术的发展为AI大模型的应用提供了足够的技术支持。同时,众多企业也纷纷加入到数据和算力产业的竞争中。

就拿“造芯”企业来说。据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%;2021年新增4.79万家,同比增长102.30%;而仅2022年上半年,新增芯片相关企业就高达3.08万家。

除了芯片企业疯狂冒出外,最具代表性的AI芯片企业寒武纪的股价也一改往日一蹶不振的颓势,逆势向上。3月,寒武纪的股价依旧处于低谷期,每股70元上下,到如今三个月不到的时间,涨到了逼近200元每股的价格,市值也直接涨到了825亿元。

另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。

但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑水摸鱼,市场愈发混乱。

这一幕,似曾相识。当初AlphaGo出现后,AI相关企业也如雨后春笋般拔地而起。但一轮又一轮洗牌后,留下来的企业依旧陷入了低谷期,找不到落地场景,商业化受阻。直到2022年年底,这些依旧是剩下来的AI独角兽们一直存在的问题。

ChatGPT就像曾经的AlphaGo一样,一石激起千层浪。但即便是惊涛骇浪后,依旧归于平静。如今的大模型,是时候该反思了。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章
|
11天前
|
人工智能 并行计算 安全
从零到一,打造专属AI王国!大模型私有化部署全攻略,手把手教你搭建、优化与安全设置
【10月更文挑战第24天】本文详细介绍从零开始的大模型私有化部署流程,涵盖需求分析、环境搭建、模型准备、模型部署、性能优化和安全设置六个关键步骤,并提供相应的示例代码,确保企业能够高效、安全地将大型AI模型部署在本地或私有云上。
93 7
|
7天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
42 2
|
11天前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
【10月更文挑战第31天】2024年,AI大模型在软件开发领域的应用取得了显著进展,从自动化代码生成、智能代码审查到智能化测试,极大地提升了开发效率和代码质量。然而,技术挑战、伦理与安全问题以及模型可解释性仍是亟待解决的关键问题。开发者需不断学习和适应,以充分利用AI的优势。
|
4天前
|
人工智能 JSON 自然语言处理
基于文档智能&RAG搭建更懂业务的AI大模型
本文介绍了一种结合文档智能和检索增强生成(RAG)技术,构建强大LLM知识库的方法。通过清洗文档内容、向量化处理和特定Prompt,提供足够的上下文信息,实现对企业级文档的智能问答。文档智能(Document Mind)能够高效解析多种文档格式,确保语义的连贯性和准确性。整个部署过程简单快捷,适合处理复杂的企业文档,提升信息提取和利用效率。
|
6天前
|
人工智能
热门 新 1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
热门 新 1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
26 3
|
11天前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
37 6
|
7天前
|
人工智能
热门 新 1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
热门 新 1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
25 2
|
10天前
|
人工智能 Serverless API
电销行业的福音|AI大模型助力客户对话分析
本文介绍了如何利用AI大模型助力电销行业的客户对话分析,通过对象存储、智能对话分析技术和通义千问大模型,实现从客户语音和聊天互动中识别意图、发现服务质量问题,提升用户体验。方案部署简单,按量计费,帮助企业快速从海量对话数据中提取有价值的信息。
|
6天前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。