一线工程师 2025 总结：LLM 只用了不到 10%，剩下 90% 卡在哪？-阿里云开发者社区

一线工程师 2025 总结：LLM 只用了不到 10%，剩下 90% 卡在哪？

2026-01-06 52

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 2025年，LLM能力爆发，但多数企业仅用到其10%。真正瓶颈不在模型强弱，而在工程落地：延迟不可控、并发崩溃、换模成本高、成本失控成常态。当LLM从“工具”变为“基础设施”，中转层与系统稳定性成为关键。释放剩余90%潜力，需扎实的架构设计与工程治理。

2025 年，是很多工程师真正对 LLM “祛魅”的一年。

模型更强了，参数更多了，Benchmark 一次次被刷新。但与此同时，另一种声音在一线越来越清晰：

不是模型不行，是我们根本没把模型用起来。

在过去一年里，我参与或旁观了十多个 AI 项目从立项、试跑到上线，有的跑通了，有的悄无声息地停在了中途。复盘下来，一个结论越来越明确：

LLM 的能力，可能只被用到了 10%；剩下的 90%，卡在工程层。

一、那 10%，用在了哪里？

先说“已经被用到的那一小部分”。

大多数团队对 LLM 的使用，集中在这些场景：

简单对话 / 问答
文案生成
代码补全
单轮 Agent 调用
内部工具提效

这些场景的共同点是：

请求不密集
出错成本低
不需要强 SLA
偶尔慢一点、错一点可以接受

在这个层级，模型能力决定体验。

所以很多人会误以为：

“模型已经这么强了，AI 应该很好落地。”

但真正的问题，从你试图把 LLM 接进 核心系统 的那一刻开始。

二、真正没被释放的 90%，卡在什么地方？

1️⃣ 卡在「延迟不可预测」

Demo 阶段你会发现：

有时 500ms
有时 3 秒
有时直接超时

当 LLM 进入这些场景时：

客服系统
搜索补全
实时决策
多 Agent 协同

“平均延迟”这个指标已经没有意义了，P95 / P99 才是真正的生死线。

但很多团队第一次上线时才发现：

原来 API 的延迟，比模型能力更影响用户体验。

2️⃣ 卡在「并发一上来就不稳」

一开始是这样的：

测试环境：一切正常
小流量灰度：还能接受
正式上线：429、502、超时轮番出现

原因并不复杂：

官方 API 的并发限制
网络抖动
单模型单通道
没有请求缓冲和降级

模型没崩，系统先崩了。

这也是为什么很多 AI 项目不是“失败”，而是“被悄悄下线”。

3️⃣ 卡在「模型不是随便就能换」

理论上大家都说：

“模型不行就换。”

现实是：

Prompt 强绑定模型行为
不同模型 token 结构不同
输出稳定性差异巨大
切换成本远高于想象

结果就是：

模型选型一旦失误，整个系统就被锁死。

这 90% 的潜力，不是模型没给，是工程结构不允许你用。

4️⃣ 卡在「成本失控，但没人能提前算清楚」

2025 年，很多团队第一次被 LLM 账单“教育”。

单次调用不贵
乘以 QPS
再乘以全天
再叠加重试

最后发现：

AI 成了系统里最不可控的一项成本。

而真正的问题是：
调用路径不透明、缺乏统一治理。

三、真正的分水岭：LLM 是“工具”，还是“基础设施”？

到这里，很多工程师会意识到一个转折点：

如果你只是“用模型”，问题不大
如果你要“跑系统”，问题全来了

当 LLM 变成长期运行的能力，你关心的就不再是：

模型强不强

而是：

稳不稳定
能不能兜底
能不能切换
成本是否可控
出事能不能止血

这时候，模型已经退居二线，API 接入层成为主角。

四、为什么越来越多团队开始重视“中转层”？

2025 年，一个明显的趋势是：

工程团队开始把 LLM 当成外部不稳定依赖来治理。

这催生了对中转 API / 聚合层的真实需求：

统一入口
多模型路由
并发与限流
失败自动切换
成本结构透明

也正是在大量企业真实踩坑之后，像 poloapi.top 这样的中转API平台，开始被放到“基础设施”层面来评估，而不再只是“便捷工具”。

五、写在最后：LLM 的上限，不在模型发布会

回头看 2025 年，你会发现一个很现实的结论：

LLM 的能力早就在那里了，只是大多数系统接不住。

真正限制 AI 上限的，不是参数规模，也不是新模型发布时间，而是：

工程结构是否允许规模化
API 是否足够稳定
架构是否为长期运行而设计

当这些问题被解决，那剩下的 90% 潜力，才有被真正释放的可能。

而这，恰恰不是模型公司最擅长的事，却是一线工程世界里，必须有人把坑踩完、把路铺平的部分。