科技云报道:国内AI大模型鏖战,上演科技罗生门

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 四大派系初现

科技云报道原创。

ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者、投资人以及企业可以说有过之无不及。
于是,这些投资人、从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产品。一时间,大模型赛道好不热闹。

毫不夸张地说,从3月份至今,国内几乎每一周都有企业推出自己的大模型产品。上一周,科大讯飞公布了星火认知大模型后不久,云从科技就被爆出即将在5月18日发布大模型产品。

随着大模型产品的推出,其背后公司股价也是一路飘红。更为奇幻的一幕出现了,只要是沾上了大模型的边,公司股价就会蹭蹭上涨。

拿云从科技来说,尽管只是放出了产品发布的消息,云从科技近几天的股价也是一路向红。此前,在概念股疯长的阶段,得益于其AI相关业务属性,云从科技的股价早已经历经过一轮上涨,股价从26元每股涨至61.8元每股。

这又燃起了更多人对大模型的向往。周而复始间,国内大模型可以说是“百家争鸣”。但问题紧跟着出现,这些企业或者是人做入局大模型的原因何在?是与公司业务紧密相关,还是个人追求,又或是单纯的蹭热度?

另外,在大模型遍地开花的现在,又有哪些企业真正做到了场景落地,又有哪些是严重同质化,会被轻易取代?
国内大模型市场,俨然像是开启了一场科技盛宴,但其中鱼龙混杂的参会人员,让这场盛宴变得更为扑所迷离。

四大派系

三月份以来,两个时间节点可以说是让媒体人刻骨铭心。

一个是三月的第三周。那一周,周二深夜,ChatGPT4发布。周四下午,百度文心一言发布。紧接着凌晨时分,微软宣布将ChatGPT能力接入Office全家桶。

另外一个是4月18日,这一天,6个关于大模型的重要消息密集发布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…

“键盘敲到要冒烟”可以算是当时媒体人的真实写照。不过,尽管写稿写到绝望,依旧掩盖不住地兴奋之情。
可以说,媒体人的状态侧面显露了当时的盛况。

据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。当然,除了这超40家的企业、机构之外,还有不少企业和互联网大佬都透露出自己正在做大模型相关的产品的消息。

为了更好的分析企业的出发点、优劣势,我们从企业的性质出发,将这些已经或者入局在做大模型产品的企业和人分为这四大派系:互联网科技大厂以及科研机构、初创公司以及互联网大佬、AI企业(包括上市公司和创业独角兽)、跨界企业。

派系一:互联网科技大厂以及科研院所

互联网科技大厂和科研院所可以算是国内AI大模型领域的领头羊。这些大厂和机构拥有强大的技术实力和庞大的数据资源,同时互联网科技大厂还可以通过其它业务实现AI大模型的商业化应用。

比较典型的就是,百度有文心大模型以及文心一言;阿里有通义大模型和通义千问;腾讯有混元大模型和混元助手;华为有盘古大模型;字节跳动有飞书“My AI”;京东有ChatJD;360有360智脑;科大讯飞有讯飞星火等。

另外,科研院所的代表则是复旦大学邱锡鹏教授团队的对话式大语言模型MOSS、上海人工智能实验室的天气预报大模型“风乌”、清华大学的GLM-130B、北京智源人工智能研究院“悟道2.0”等等。

值得注意的是,这些互联网大厂的大部分模型已经开放了内测名额,普通受众也可以通过报名的方式体验大模型。
派系二:AI企业(上市公司和创业独角兽)

AI企业是中国AI大模型领域的另一个重要力量。这些企业在技术创新和商业模式上具有很强的专业性和深度,同时也可以通过资本市场的支持来加速其业务拓展。例如,旷视科技、商汤科技、云从科技等企业在图像识别、人脸识别等领域中均表现不俗。

具体来说,商汤科技发布了日日新SenseNova和商量、毫末智行发布了自动驾驶生成式大模型DriveGPT、竹简智能发布了魔力写作等等。

值得注意的是,目前AI企业推出的大模型更多是面向B端,因此大部分并未开放给普通用户测试。

派系三:初创公司以及互联网大佬

初创公司和互联网大佬是中国AI大模型领域的另一个重要力量。但目前,宣布入局大模型的互联网大佬还并未推出具体的产品。不过,凭借着其互联网老兵的身份以及技术实力等,他们依旧可以拿到天使轮融资,并且吸引很多人才。

王小川和王慧文即是如此。有意思的是,王小川为了宣布入局大模型一事,在搜狐大厦召开了媒体发布会,而楼上,就是王慧文做大模型的办公地点。

另外,有一个不得不说的前提,这些互联网老兵拿到的第一笔钱即5000万美金。此后,5000万美金也成了入局大模型的一道门槛。

派系四:跨界企业

从其他领域跨界的企业是中国AI大模型领域的一大特点。这些企业在自身领域内拥有丰富的数据资源和技术经验,通过AI大模型技术的运用,可以实现多个领域之间的交叉应用。例如,教育行业的学而思发布了MathGPT,专攻数学大模型,主要就是与其教学业务相结合。

为什么要做大模型?

梳理完企业后,不得不抛出一个问题,为什么要做大模型?

笼统来说,无外乎有下述几点原因:大模型可以为企业带来很多商业机会和收益,AI大模型是当前AI技术发展的重要方向之一,各个企业加入到竞争中也符合市场趋势和国家发展需求。

不过,具体来看,这四大派系的做大模型的原因、以及目的还是有所不同。

派系一:互联网科技大厂和科研院所

科研院所不必多说,学术研究使然,重点在于互联网科技大厂。

首先是,互联网科技大厂必须要做大模型。

就百度来说,从2017年李彦宏提出All in AI后,百度的业务巨轮从此前的搜索引擎和互联网业务转向了AI技术落地自动驾驶、智能云。尽管如此,在商业化落地上,AI目前仍未能取得突破性进展。从百度2022年年报来看,百度的收入基本盘依旧是以广告为主的互联网业务收入。

百度不得不去做大模型,争分夺秒去推文心一言。当然,百度也有能力去做文心一言。百度在AI领域的积累——海量数据、算力、算法以及预训练大模型,已经具备了生成类似项目的条件。

百度做的目的,已经逐渐显露出来——与自身业务结合,寻求技术落地,实现商业化。如与搜索引擎结合,或许会带来互联网广告收入形式的革新,以及出现新形式的增值服务,有不小的想象空间。

此外,百度还发公告称,小度将融合文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」,应用到小度全系产品。更为重要的是,百度另一大业务,智能汽车中的车载场景同样如此。

阿里、腾讯、甚至京东等大厂都可以以此类推。

总结来说,互联网科技大厂拥有丰富的数据资源和高算力支持,这也为它们在AI大模型领域拥有独特的优势。在AI大模型的研发和应用中,大数据和算力是至关重要的,而互联网科技大厂在这方面已经具备了很高的技术实力和经验积累。同样,他们拥有广泛的业务场景,可以在技术支持下实现场景的落地。

派系二:AI企业(上市公司和创业独角兽)

AI技术的专业公司,这些企业在AI大模型领域拥有很强的技术实力和经验积累。

毫末智行官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。这不得不引人发文,自动驾驶也需要GPT么?实际上,自动驾驶进入3.0时代后,不再是硬件或者软件驱动,不再是测试道路下的数据驱动,而是以真实道路行驶场景为核心的数据驱动。AI依然是核心技术,与1.0、2.0时代不同就在于AI对数据的要求发生了质变,“大模型”成为新的技术基石。

派系三:初创公司以及互联网大佬

初创公司通常具有较为灵活的运营模式和创新思维,更容易迅速适应市场需求并开展相应的业务。在AI大模型领域,初创公司可以通过创新的技术和业务模式来获取商业机会。

王小川在入局大模型赛道后,就一直强调未来发力的方向并不是像OpenAI一样去做AGI(通用人工智能),而是垂直在某些特定的领域去做大模型,并实现落地应用。

派系四:跨界企业

跨界企业不用多说的是,会与自身业务相结合,比如说垂直到教育、医疗、金融、房地产等领域。

不过,需要警惕的是,不少跨界的企业大有蹭热度,拉高股价的嫌疑。毕竟,能够做出真正实用的大模型离不开高额的投入、精进的算法、海量数据等。

泡沫横生,再现罗生门

大模型火热,正面展现了国内的科技热情,阴面却是泡沫横生。

在ChatGPT出现后,国内最开始传出入局大模型的企业,其实只有互联网科技大厂和AI企业。毕竟,这些企业有着AI背景,要么有数据、要么有算法、要么有资金投入或者是人才投入。

但是随着ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座后,不少其他赛道的企业,或者是靠近AI边缘业务的企业也纷纷下场,去推出大模型产品或者是透露出做大模型的战略规划。

但这无疑主动放大了市场需求,打乱了市场发展节奏。最明显的表现,除了企业纷纷下场去做大模型外,还间接拉动了相关产业链的需求。

AI大模型作为一项前沿技术,其产业链包括了算力、数据、算法等多个环节。在这些环节中,算力和数据是AI大模型发展的关键。

当前,国内算力和数据产业的发展已经进入到一个快速发展的阶段。云计算、大数据、物联网等技术的发展为AI大模型的应用提供了足够的技术支持。同时,众多企业也纷纷加入到数据和算力产业的竞争中。

就拿“造芯”企业来说。据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%;2021年新增4.79万家,同比增长102.30%;而仅2022年上半年,新增芯片相关企业就高达3.08万家。

除了芯片企业疯狂冒出外,最具代表性的AI芯片企业寒武纪的股价也一改往日一蹶不振的颓势,逆势向上。3月,寒武纪的股价依旧处于低谷期,每股70元上下,到如今三个月不到的时间,涨到了逼近200元每股的价格,市值也直接涨到了825亿元。

另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。

但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑水摸鱼,市场愈发混乱。

这一幕,似曾相识。当初AlphaGo出现后,AI相关企业也如雨后春笋般拔地而起。但一轮又一轮洗牌后,留下来的企业依旧陷入了低谷期,找不到落地场景,商业化受阻。直到2022年年底,这些依旧是剩下来的AI独角兽们一直存在的问题。

ChatGPT就像曾经的AlphaGo一样,一石激起千层浪。但即便是惊涛骇浪后,依旧归于平静。如今的大模型,是时候该反思了。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章
|
2天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
14天前
|
人工智能 安全 数据安全/隐私保护
文档智能 & RAG让AI大模型更懂业务测评
文档智能 & RAG让AI大模型更懂业务
142 73
|
4天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
55 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
2天前
|
机器学习/深度学习 人工智能 智能设计
VisionFM:通用眼科 AI 大模型,具备眼科疾病诊断能力,展现出专家级别的准确性
VisionFM 是一个多模态多任务的视觉基础模型,专为通用眼科人工智能设计。通过预训练大量眼科图像,模型能够处理多种眼科成像模态,并在多种眼科任务中展现出专家级别的智能性和准确性。
25 4
VisionFM:通用眼科 AI 大模型,具备眼科疾病诊断能力,展现出专家级别的准确性
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
100 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
14天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
65 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
16天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
57 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
16天前
|
人工智能 搜索推荐 开发者
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
Aurora是xAI为Grok AI助手推出的新图像生成模型,专注于生成高逼真度的图像,特别是在人物和风景图像方面。该模型支持文本到图像的生成,并能处理包括公共人物和版权形象在内的多种图像生成请求。Aurora的可用性因用户等级而异,免费用户每天能生成三张图像,而Premium用户则可享受无限制访问。
56 11
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
|
2天前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
26 13
|
15天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。

热门文章

最新文章