科技云报道:国内AI大模型鏖战,上演科技罗生门

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 四大派系初现

科技云报道原创。

ChatGPT的狂热从年初持续至今,这份狂热不仅仅来源于用户层,从业者、投资人以及企业可以说有过之无不及。
于是,这些投资人、从业者以及企业将狂热转化,宣布入局大模型赛道并推出相关产品。一时间,大模型赛道好不热闹。

毫不夸张地说,从3月份至今,国内几乎每一周都有企业推出自己的大模型产品。上一周,科大讯飞公布了星火认知大模型后不久,云从科技就被爆出即将在5月18日发布大模型产品。

随着大模型产品的推出,其背后公司股价也是一路飘红。更为奇幻的一幕出现了,只要是沾上了大模型的边,公司股价就会蹭蹭上涨。

拿云从科技来说,尽管只是放出了产品发布的消息,云从科技近几天的股价也是一路向红。此前,在概念股疯长的阶段,得益于其AI相关业务属性,云从科技的股价早已经历经过一轮上涨,股价从26元每股涨至61.8元每股。

这又燃起了更多人对大模型的向往。周而复始间,国内大模型可以说是“百家争鸣”。但问题紧跟着出现,这些企业或者是人做入局大模型的原因何在?是与公司业务紧密相关,还是个人追求,又或是单纯的蹭热度?

另外,在大模型遍地开花的现在,又有哪些企业真正做到了场景落地,又有哪些是严重同质化,会被轻易取代?
国内大模型市场,俨然像是开启了一场科技盛宴,但其中鱼龙混杂的参会人员,让这场盛宴变得更为扑所迷离。

四大派系

三月份以来,两个时间节点可以说是让媒体人刻骨铭心。

一个是三月的第三周。那一周,周二深夜,ChatGPT4发布。周四下午,百度文心一言发布。紧接着凌晨时分,微软宣布将ChatGPT能力接入Office全家桶。

另外一个是4月18日,这一天,6个关于大模型的重要消息密集发布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…

“键盘敲到要冒烟”可以算是当时媒体人的真实写照。不过,尽管写稿写到绝望,依旧掩盖不住地兴奋之情。
可以说,媒体人的状态侧面显露了当时的盛况。

据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。当然,除了这超40家的企业、机构之外,还有不少企业和互联网大佬都透露出自己正在做大模型相关的产品的消息。

为了更好的分析企业的出发点、优劣势,我们从企业的性质出发,将这些已经或者入局在做大模型产品的企业和人分为这四大派系:互联网科技大厂以及科研机构、初创公司以及互联网大佬、AI企业(包括上市公司和创业独角兽)、跨界企业。

派系一:互联网科技大厂以及科研院所

互联网科技大厂和科研院所可以算是国内AI大模型领域的领头羊。这些大厂和机构拥有强大的技术实力和庞大的数据资源,同时互联网科技大厂还可以通过其它业务实现AI大模型的商业化应用。

比较典型的就是,百度有文心大模型以及文心一言;阿里有通义大模型和通义千问;腾讯有混元大模型和混元助手;华为有盘古大模型;字节跳动有飞书“My AI”;京东有ChatJD;360有360智脑;科大讯飞有讯飞星火等。

另外,科研院所的代表则是复旦大学邱锡鹏教授团队的对话式大语言模型MOSS、上海人工智能实验室的天气预报大模型“风乌”、清华大学的GLM-130B、北京智源人工智能研究院“悟道2.0”等等。

值得注意的是,这些互联网大厂的大部分模型已经开放了内测名额,普通受众也可以通过报名的方式体验大模型。
派系二:AI企业(上市公司和创业独角兽)

AI企业是中国AI大模型领域的另一个重要力量。这些企业在技术创新和商业模式上具有很强的专业性和深度,同时也可以通过资本市场的支持来加速其业务拓展。例如,旷视科技、商汤科技、云从科技等企业在图像识别、人脸识别等领域中均表现不俗。

具体来说,商汤科技发布了日日新SenseNova和商量、毫末智行发布了自动驾驶生成式大模型DriveGPT、竹简智能发布了魔力写作等等。

值得注意的是,目前AI企业推出的大模型更多是面向B端,因此大部分并未开放给普通用户测试。

派系三:初创公司以及互联网大佬

初创公司和互联网大佬是中国AI大模型领域的另一个重要力量。但目前,宣布入局大模型的互联网大佬还并未推出具体的产品。不过,凭借着其互联网老兵的身份以及技术实力等,他们依旧可以拿到天使轮融资,并且吸引很多人才。

王小川和王慧文即是如此。有意思的是,王小川为了宣布入局大模型一事,在搜狐大厦召开了媒体发布会,而楼上,就是王慧文做大模型的办公地点。

另外,有一个不得不说的前提,这些互联网老兵拿到的第一笔钱即5000万美金。此后,5000万美金也成了入局大模型的一道门槛。

派系四:跨界企业

从其他领域跨界的企业是中国AI大模型领域的一大特点。这些企业在自身领域内拥有丰富的数据资源和技术经验,通过AI大模型技术的运用,可以实现多个领域之间的交叉应用。例如,教育行业的学而思发布了MathGPT,专攻数学大模型,主要就是与其教学业务相结合。

为什么要做大模型?

梳理完企业后,不得不抛出一个问题,为什么要做大模型?

笼统来说,无外乎有下述几点原因:大模型可以为企业带来很多商业机会和收益,AI大模型是当前AI技术发展的重要方向之一,各个企业加入到竞争中也符合市场趋势和国家发展需求。

不过,具体来看,这四大派系的做大模型的原因、以及目的还是有所不同。

派系一:互联网科技大厂和科研院所

科研院所不必多说,学术研究使然,重点在于互联网科技大厂。

首先是,互联网科技大厂必须要做大模型。

就百度来说,从2017年李彦宏提出All in AI后,百度的业务巨轮从此前的搜索引擎和互联网业务转向了AI技术落地自动驾驶、智能云。尽管如此,在商业化落地上,AI目前仍未能取得突破性进展。从百度2022年年报来看,百度的收入基本盘依旧是以广告为主的互联网业务收入。

百度不得不去做大模型,争分夺秒去推文心一言。当然,百度也有能力去做文心一言。百度在AI领域的积累——海量数据、算力、算法以及预训练大模型,已经具备了生成类似项目的条件。

百度做的目的,已经逐渐显露出来——与自身业务结合,寻求技术落地,实现商业化。如与搜索引擎结合,或许会带来互联网广告收入形式的革新,以及出现新形式的增值服务,有不小的想象空间。

此外,百度还发公告称,小度将融合文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」,应用到小度全系产品。更为重要的是,百度另一大业务,智能汽车中的车载场景同样如此。

阿里、腾讯、甚至京东等大厂都可以以此类推。

总结来说,互联网科技大厂拥有丰富的数据资源和高算力支持,这也为它们在AI大模型领域拥有独特的优势。在AI大模型的研发和应用中,大数据和算力是至关重要的,而互联网科技大厂在这方面已经具备了很高的技术实力和经验积累。同样,他们拥有广泛的业务场景,可以在技术支持下实现场景的落地。

派系二:AI企业(上市公司和创业独角兽)

AI技术的专业公司,这些企业在AI大模型领域拥有很强的技术实力和经验积累。

毫末智行官宣首个应用GPT模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。这不得不引人发文,自动驾驶也需要GPT么?实际上,自动驾驶进入3.0时代后,不再是硬件或者软件驱动,不再是测试道路下的数据驱动,而是以真实道路行驶场景为核心的数据驱动。AI依然是核心技术,与1.0、2.0时代不同就在于AI对数据的要求发生了质变,“大模型”成为新的技术基石。

派系三:初创公司以及互联网大佬

初创公司通常具有较为灵活的运营模式和创新思维,更容易迅速适应市场需求并开展相应的业务。在AI大模型领域,初创公司可以通过创新的技术和业务模式来获取商业机会。

王小川在入局大模型赛道后,就一直强调未来发力的方向并不是像OpenAI一样去做AGI(通用人工智能),而是垂直在某些特定的领域去做大模型,并实现落地应用。

派系四:跨界企业

跨界企业不用多说的是,会与自身业务相结合,比如说垂直到教育、医疗、金融、房地产等领域。

不过,需要警惕的是,不少跨界的企业大有蹭热度,拉高股价的嫌疑。毕竟,能够做出真正实用的大模型离不开高额的投入、精进的算法、海量数据等。

泡沫横生,再现罗生门

大模型火热,正面展现了国内的科技热情,阴面却是泡沫横生。

在ChatGPT出现后,国内最开始传出入局大模型的企业,其实只有互联网科技大厂和AI企业。毕竟,这些企业有着AI背景,要么有数据、要么有算法、要么有资金投入或者是人才投入。

但是随着ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座后,不少其他赛道的企业,或者是靠近AI边缘业务的企业也纷纷下场,去推出大模型产品或者是透露出做大模型的战略规划。

但这无疑主动放大了市场需求,打乱了市场发展节奏。最明显的表现,除了企业纷纷下场去做大模型外,还间接拉动了相关产业链的需求。

AI大模型作为一项前沿技术,其产业链包括了算力、数据、算法等多个环节。在这些环节中,算力和数据是AI大模型发展的关键。

当前,国内算力和数据产业的发展已经进入到一个快速发展的阶段。云计算、大数据、物联网等技术的发展为AI大模型的应用提供了足够的技术支持。同时,众多企业也纷纷加入到数据和算力产业的竞争中。

就拿“造芯”企业来说。据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%;2021年新增4.79万家,同比增长102.30%;而仅2022年上半年,新增芯片相关企业就高达3.08万家。

除了芯片企业疯狂冒出外,最具代表性的AI芯片企业寒武纪的股价也一改往日一蹶不振的颓势,逆势向上。3月,寒武纪的股价依旧处于低谷期,每股70元上下,到如今三个月不到的时间,涨到了逼近200元每股的价格,市值也直接涨到了825亿元。

另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。

但大模型的需求真就如此之大么?产业链的需求有没有虚火么?这个答案显而易见。虚火旺盛,泡沫横生,不少投机者也在其中浑水摸鱼,市场愈发混乱。

这一幕,似曾相识。当初AlphaGo出现后,AI相关企业也如雨后春笋般拔地而起。但一轮又一轮洗牌后,留下来的企业依旧陷入了低谷期,找不到落地场景,商业化受阻。直到2022年年底,这些依旧是剩下来的AI独角兽们一直存在的问题。

ChatGPT就像曾经的AlphaGo一样,一石激起千层浪。但即便是惊涛骇浪后,依旧归于平静。如今的大模型,是时候该反思了。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
5天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
35 3
|
7天前
|
人工智能 弹性计算 Serverless
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
本文介绍了零售业中“人—货—场”三要素的变化,指出传统营销方式已难以吸引消费者。现代消费者更注重个性化体验,因此需要提供超出预期的内容。文章还介绍了阿里云基于函数计算的AI大模型,特别是Stable Diffusion WebUI,帮助非专业人士轻松制作高质量的促销海报。通过详细的部署步骤和实践经验,展示了该方案在实际生产环境中的应用价值。
38 6
触手可及,函数计算玩转 AI 大模型 | 简单几步,轻松实现AI绘图
|
4天前
|
人工智能 新制造 芯片
2024年中国AI大模型产业发展报告解读
2024年,中国AI大模型产业迎来蓬勃发展,成为科技和经济增长的新引擎。本文解读《2024年中国AI大模型产业发展报告》,探讨产业发展背景、现状、挑战与未来趋势。技术进步显著,应用广泛,但算力瓶颈、资源消耗和训练数据不足仍是主要挑战。未来,云侧与端侧模型分化、通用与专用模型并存、大模型开源和芯片技术升级将是主要发展方向。
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
【10月更文挑战第31天】2024年,AI大模型在软件开发领域的应用取得了显著进展,从自动化代码生成、智能代码审查到智能化测试,极大地提升了开发效率和代码质量。然而,技术挑战、伦理与安全问题以及模型可解释性仍是亟待解决的关键问题。开发者需不断学习和适应,以充分利用AI的优势。
|
5天前
|
存储 人工智能 固态存储
如何应对生成式AI和大模型应用带来的存储挑战
如何应对生成式AI和大模型应用带来的存储挑战
|
7天前
|
人工智能 算法 新制造
走进北京科技大学,通义灵码与企业高校共筑 AI 创意课堂
近日,通义灵码有幸参与到一场由伊利集团主办的 AIGC 生态创新大赛路演舞台,与高校专家、企业代表、青年学子共同探讨 AIGC 创意应用,交流企业在数智领域转型、青年开发者科技创新的思路和落地实践。
|
12天前
|
人工智能 JSON 自然语言处理
基于文档智能&RAG搭建更懂业务的AI大模型
本文介绍了一种结合文档智能和检索增强生成(RAG)技术,构建强大LLM知识库的方法。通过清洗文档内容、向量化处理和特定Prompt,提供足够的上下文信息,实现对企业级文档的智能问答。文档智能(Document Mind)能够高效解析多种文档格式,确保语义的连贯性和准确性。整个部署过程简单快捷,适合处理复杂的企业文档,提升信息提取和利用效率。
|
8天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
44 4
|
13天前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。

热门文章

最新文章