国际市场调研机构沙利文(Frost&Sullivan)发布了最新一期《中国GenAI市场洞察:企业级大模型调用全景研究2025H2》报告,调研用户通过公有云、本地部署、MaaS等使用大模型的不同方式,盘点中国企业级大模型调用市场的全景。2025年下半年,中国企业级市场大模型的日均总消耗量为37万亿Tokens,其中,千问大模型占比32.1%位列第一,成为目前中国企业选择最多的大模型。

2025H2,中国企业级大模型日均调用量提升至37.0万亿Tokens,较2025H1的10.2万亿Tokens增长263%,实现阶段性跃迁。2025H2日均调用量的跃迁,本质上反映的是AI从“企业边缘辅助”向“企业操作系统核心”的渗透。在这一阶段,调用增长不再仅仅是用户数的增长,而是单个业务流中AI参与密度的增长,大模型已成为驱动企业生产效率阶梯式上升的基础设施。2025年H2大模型调用量实现阶段性跃迁,其原因在于:
从“对话式AI”向“Agentic Workflow(智能体工作流)”的范式转移:2025年H1期间的大模型应用多为简单的单次对话,而2025年H2期间,企业重心转向自主智能体,开始构建能够自主规划、调用工具并循环迭代的智能体系统。Agent通过任务拆解自动触发多轮调用,这种“自动触发、多轮反馈”的机制使得单次业务处理对Tokens的消耗呈几何倍数增长,单次人工指令产生5-10倍的Tokens杠杆效应。
推理成本的“价格拐点”释放长尾需求:由于API成本已接近“水电煤”化,企业不再对调用量进行严格限额,转而追求“全流程、全员化”的覆盖,原本被高成本抑制的非核心业务需求在H2集中爆发。
推理能力增强带动“单次请求价值”的提升:随着R3或同级别深度思考模型的成熟,模型在生成答案前会进行大量的内部“思考(CoT)”,这些不直接显现但计入调用的推理Tokens极大地抬升H2的统计基数。
开源模型调用量占比已达56%,成为企业客户使用模型的重要选择。闭源模型调用量占比44%,扭转了上半年闭源为主、开源为辅的地位。2025 年下半年,仍持续更新闭源基础语言模型的企业数量从此前的29家大幅缩减至仅7家。更多模型厂商开始探索开源模型路径,寻找差异化的竞争力,智谱和Kimi分别将原本闭源定位的旗舰模型进行开源,这也是开源生态迅猛发展的重要因素。
