科技云报道:国内AI大模型鏖战,上演科技罗生门

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 四大派系初现

科技云报道原创。

ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者、投资人以及企业可以说有过之无不及。
于是,这些投资人、从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产品。一时间,大模型赛道好不热闹。

毫不夸张地说,从3月份至今,国内几乎每一周都有企业推出自己的大模型产品。上一周,科大讯飞公布了星火认知大模型后不久,云从科技就被爆出即将在5月18日发布大模型产品。

随着大模型产品的推出,其背后公司股价也是一路飘红。更为奇幻的一幕出现了,只要是沾上了大模型的边,公司股价就会蹭蹭上涨。

拿云从科技来说,尽管只是放出了产品发布的消息,云从科技近几天的股价也是一路向红。此前,在概念股疯长的阶段,得益于其AI相关业务属性,云从科技的股价早已经历经过一轮上涨,股价从26元每股涨至61.8元每股。

这又燃起了更多人对大模型的向往。周而复始间,国内大模型可以说是“百家争鸣”。但问题紧跟着出现,这些企业或者是人做入局大模型的原因何在?是与公司业务紧密相关,还是个人追求,又或是单纯的蹭热度?

另外,在大模型遍地开花的现在,又有哪些企业真正做到了场景落地,又有哪些是严重同质化,会被轻易取代?
国内大模型市场,俨然像是开启了一场科技盛宴,但其中鱼龙混杂的参会人员,让这场盛宴变得更为扑所迷离。

四大派系

三月份以来,两个时间节点可以说是让媒体人刻骨铭心。

一个是三月的第三周。那一周,周二深夜,ChatGPT4发布。周四下午,百度文心一言发布。紧接着凌晨时分,微软宣布将ChatGPT能力接入Office全家桶。

另外一个是4月18日,这一天,6个关于大模型的重要消息密集发布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…

“键盘敲到要冒烟”可以算是当时媒体人的真实写照。不过,尽管写稿写到绝望,依旧掩盖不住地兴奋之情。
可以说,媒体人的状态侧面显露了当时的盛况。

据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。当然,除了这超40家的企业、机构之外,还有不少企业和互联网大佬都透露出自己正在做大模型相关的产品的消息。

为了更好的分析企业的出发点、优劣势,我们从企业的性质出发,将这些已经或者入局在做大模型产品的企业和人分为这四大派系:互联网科技大厂以及科研机构、初创公司以及互联网大佬、AI企业(包括上市公司和创业独角兽)、跨界企业。

派系一:互联网科技大厂以及科研院所

互联网科技大厂和科研院所可以算是国内AI大模型领域的领头羊。这些大厂和机构拥有强大的技术实力和庞大的数据资源,同时互联网科技大厂还可以通过其它业务实现AI大模型的商业化应用。

比较典型的就是,百度有文心大模型以及文心一言;阿里有通义大模型和通义千问;腾讯有混元大模型和混元助手;华为有盘古大模型;字节跳动有飞书“My AI”;京东有ChatJD;360有360智脑;科大讯飞有讯飞星火等。

另外,科研院所的代表则是复旦大学邱锡鹏教授团队的对话式大语言模型MOSS、上海人工智能实验室的天气预报大模型“风乌”、清华大学的GLM-130B、北京智源人工智能研究院“悟道2.0”等等。

值得注意的是,这些互联网大厂的大部分模型已经开放了内测名额,普通受众也可以通过报名的方式体验大模型。
派系二:AI企业(上市公司和创业独角兽)

AI企业是中国AI大模型领域的另一个重要力量。这些企业在技术创新和商业模式上具有很强的专业性和深度,同时也可以通过资本市场的支持来加速其业务拓展。例如,旷视科技、商汤科技、云从科技等企业在图像识别、人脸识别等领域中均表现不俗。

具体来说,商汤科技发布了日日新SenseNova和商量、毫末智行发布了自动驾驶生成式大模型DriveGPT、竹简智能发布了魔力写作等等。

值得注意的是,目前AI企业推出的大模型更多是面向B端,因此大部分并未开放给普通用户测试。

派系三:初创公司以及互联网大佬

初创公司和互联网大佬是中国AI大模型领域的另一个重要力量。但目前,宣布入局大模型的互联网大佬还并未推出具体的产品。不过,凭借着其互联网老兵的身份以及技术实力等,他们依旧可以拿到天使轮融资,并且吸引很多人才。

王小川和王慧文即是如此。有意思的是,王小川为了宣布入局大模型一事,在搜狐大厦召开了媒体发布会,而楼上,就是王慧文做大模型的办公地点。

另外,有一个不得不说的前提,这些互联网老兵拿到的第一笔钱即5000万美金。此后,5000万美金也成了入局大模型的一道门槛。

派系四:跨界企业

从其他领域跨界的企业是中国AI大模型领域的一大特点。这些企业在自身领域内拥有丰富的数据资源和技术经验,通过AI大模型技术的运用,可以实现多个领域之间的交叉应用。例如,教育行业的学而思发布了MathGPT,专攻数学大模型,主要就是与其教学业务相结合。

为什么要做大模型?

梳理完企业后,不得不抛出一个问题,为什么要做大模型?

笼统来说,无外乎有下述几点原因:大模型可以为企业带来很多商业机会和收益,AI大模型是当前AI技术发展的重要方向之一,各个企业加入到竞争中也符合市场趋势和国家发展需求。

不过,具体来看,这四大派系的做大模型的原因、以及目的还是有所不同。

派系一:互联网科技大厂和科研院所

科研院所不必多说,学术研究使然,重点在于互联网科技大厂。

首先是,互联网科技大厂必须要做大模型。

就百度来说,从2017年李彦宏提出All in AI后,百度的业务巨轮从此前的搜索引擎和互联网业务转向了AI技术落地自动驾驶、智能云。尽管如此,在商业化落地上,AI目前仍未能取得突破性进展。从百度2022年年报来看,百度的收入基本盘依旧是以广告为主的互联网业务收入。

百度不得不去做大模型,争分夺秒去推文心一言。当然,百度也有能力去做文心一言。百度在AI领域的积累——海量数据、算力、算法以及预训练大模型,已经具备了生成类似项目的条件。

百度做的目的,已经逐渐显露出来——与自身业务结合,寻求技术落地,实现商业化。如与搜索引擎结合,或许会带来互联网广告收入形式的革新,以及出现新形式的增值服务,有不小的想象空间。

此外,百度还发公告称,小度将融合文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」,应用到小度全系产品。更为重要的是,百度另一大业务,智能汽车中的车载场景同样如此。

阿里、腾讯、甚至京东等大厂都可以以此类推。

总结来说,互联网科技大厂拥有丰富的数据资源和高算力支持,这也为它们在AI大模型领域拥有独特的优势。在AI大模型的研发和应用中,大数据和算力是至关重要的,而互联网科技大厂在这方面已经具备了很高的技术实力和经验积累。同样,他们拥有广泛的业务场景,可以在技术支持下实现场景的落地。

派系二:AI企业(上市公司和创业独角兽)

AI技术的专业公司,这些企业在AI大模型领域拥有很强的技术实力和经验积累。

毫末智行官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。这不得不引人发文,自动驾驶也需要GPT么?实际上,自动驾驶进入3.0时代后,不再是硬件或者软件驱动,不再是测试道路下的数据驱动,而是以真实道路行驶场景为核心的数据驱动。AI依然是核心技术,与1.0、2.0时代不同就在于AI对数据的要求发生了质变,“大模型”成为新的技术基石。

派系三:初创公司以及互联网大佬

初创公司通常具有较为灵活的运营模式和创新思维,更容易迅速适应市场需求并开展相应的业务。在AI大模型领域,初创公司可以通过创新的技术和业务模式来获取商业机会。

王小川在入局大模型赛道后,就一直强调未来发力的方向并不是像OpenAI一样去做AGI(通用人工智能),而是垂直在某些特定的领域去做大模型,并实现落地应用。

派系四:跨界企业

跨界企业不用多说的是,会与自身业务相结合,比如说垂直到教育、医疗、金融、房地产等领域。

不过,需要警惕的是,不少跨界的企业大有蹭热度,拉高股价的嫌疑。毕竟,能够做出真正实用的大模型离不开高额的投入、精进的算法、海量数据等。

泡沫横生,再现罗生门

大模型火热,正面展现了国内的科技热情,阴面却是泡沫横生。

在ChatGPT出现后,国内最开始传出入局大模型的企业,其实只有互联网科技大厂和AI企业。毕竟,这些企业有着AI背景,要么有数据、要么有算法、要么有资金投入或者是人才投入。

但是随着ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座后,不少其他赛道的企业,或者是靠近AI边缘业务的企业也纷纷下场,去推出大模型产品或者是透露出做大模型的战略规划。

但这无疑主动放大了市场需求,打乱了市场发展节奏。最明显的表现,除了企业纷纷下场去做大模型外,还间接拉动了相关产业链的需求。

AI大模型作为一项前沿技术,其产业链包括了算力、数据、算法等多个环节。在这些环节中,算力和数据是AI大模型发展的关键。

当前,国内算力和数据产业的发展已经进入到一个快速发展的阶段。云计算、大数据、物联网等技术的发展为AI大模型的应用提供了足够的技术支持。同时,众多企业也纷纷加入到数据和算力产业的竞争中。

就拿“造芯”企业来说。据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%;2021年新增4.79万家,同比增长102.30%;而仅2022年上半年,新增芯片相关企业就高达3.08万家。

除了芯片企业疯狂冒出外,最具代表性的AI芯片企业寒武纪的股价也一改往日一蹶不振的颓势,逆势向上。3月,寒武纪的股价依旧处于低谷期,每股70元上下,到如今三个月不到的时间,涨到了逼近200元每股的价格,市值也直接涨到了825亿元。

另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。

但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑水摸鱼,市场愈发混乱。

这一幕,似曾相识。当初AlphaGo出现后,AI相关企业也如雨后春笋般拔地而起。但一轮又一轮洗牌后,留下来的企业依旧陷入了低谷期,找不到落地场景,商业化受阻。直到2022年年底,这些依旧是剩下来的AI独角兽们一直存在的问题。

ChatGPT就像曾经的AlphaGo一样,一石激起千层浪。但即便是惊涛骇浪后,依旧归于平静。如今的大模型,是时候该反思了。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章
|
12天前
|
人工智能
AI大模型初体验
为了实现真正的A,需不断学习以提升能力。
43 3
AI大模型初体验
|
9天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
2天前
|
机器学习/深度学习 人工智能 UED
OpenAI o1模型:AI通用复杂推理的新篇章
OpenAI发布了其最新的AI模型——o1,这款模型以其独特的复杂推理能力和全新的训练方式,引起了业界的广泛关注。今天,我们就来深入剖析o1模型的特点、背后的原理,以及一些有趣的八卦信息。
116 73
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
【9月更文挑战第4天】赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
AI人工智能大模型的架构演进
随着深度学习的发展,AI大模型(Large Language Models, LLMs)在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进,包括从Transformer的提出到GPT、BERT、T5等模型的历史演变,并探讨这些模型的技术细节及其在现代人工智能中的核心作用。
31 9
|
4天前
|
人工智能 自动驾驶 云计算
【通义】AI视界|谷歌大模型被盯上!欧盟最高隐私监管机构对PaLM2模型展开调查~
本文汇总了近24小时内科技领域的五大要闻:欧盟对谷歌PaLM2模型启动隐私合规调查;甲骨文推出Zettascale云计算集群,集成大量NVIDIA GPU强化计算力;红杉资本偏好AI应用投资而非模型构建;夸克新推智能助手CueMe,支持长达2万字内容生成;沃尔沃与NVIDIA合作,未来车型将采用后者先进芯片提升自动驾驶功能。以上内容由通义自动生成。
|
6天前
|
机器学习/深度学习 人工智能 供应链
【通义】AI视界|OpenAI的“草莓”模型预计两周内上线!像人类一样思考!
本文介绍了近期科技领域的五大亮点:OpenAI即将推出的新一代AI模型“草莓”,具备高级推理能力;亚马逊测试AI技术加速有声读物生产,通过语音克隆提高效率;Kimi API新增联网搜索功能,拓宽信息来源;顺丰发布物流行业专用大语言模型“丰语”,提升工作效率;钉钉推出“AI班级群”功能,改善家校沟通体验。更多详情,请访问[通义官网]。
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
AI战略丨物流 AI 新变化,用大模型定义
物流企业在大模型上纷纷主动探索,也在推动物流行业实现智能化加速。
|
10天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
9天前
|
人工智能 测试技术 PyTorch
AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估
本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。