工业AI的价值错觉:你以为在打仗,其实还在练靶
写在前面:我不反对“高精度”,我反对“高精度当成终点”
因为一直关注阿里云社区,所以会砍到部分关工业于AI的讨论,很多都在卷预测精度:98.5% 到 99.2%,模型结构怎么改、特征怎么挑、超参怎么调。
先说结论:准确率高当然是好事。
但我想提醒一个容易被忽略的事实——在真实工业现场,大多数工业AI项目解决的,其实是 L1/L2 的问题。
而现场真正让人停机、爆产量、砸质量、烧成本的那些事,往往在 L3/L4。
如果你的AI永远停留在 L1/L2,那么你会遇到一个必然结果:
你做得越认真,现场越无感。
不是因为他们不懂AI,而是因为你解决的那部分,对我们来说不是“刚需”。
一、重新定义战场:现场故障的 L1–L4 分层
为了避免空谈,我把现场问题粗分成四层。你可以对号入座,看看你的项目在哪一层。
L1:单点标准故障(“坏了就是坏了”)
特征:定位快、因果清晰、处理流程成熟
例子:某个传感器断线、某个部件损坏、某个阀卡死
现实:这更像自动化/维修体系的地盘,AI能做,但价值不稀缺
L2:复合已知故障(“组合异常,但套路可查”)
特征:多个信号联动异常,有经验模式、有故障树可用
例子:几路压力/温度/速度出现典型耦合,符合某类已知机理
现实:这是工业AI/专家系统/统计学习最容易出成果的区域
——你们卷的预测精度,大多就在这层
L3:系统级非标故障(“参数都对,但结果就是错”)
特征:跨系统、难复现、问题定义会变化,很多关键变量事前没采
典型现象:
所有仪表都“正常”,产品却持续劣化
没有明显报警,但周期性出现异常(堆积/波动/废品)
现实:这类问题才是现场真正消耗人的地方,也是“老师傅直觉”的来源
——同时也是现有AI最容易失效的地方
L4:演化型未知故障(“新工艺把旧经验打碎”)
特征:工艺迭代带来新机制,新分布、新边界、新风险
现实:它不是“故障”,更像系统进化带来的未知域
二、工业AI工程师最常见的误判:把 L2 的胜利当成工业AI的胜利
如果你站在算法视角,很容易误以为:
“我把L2做到了99%,工业AI就成了。”
但站在现场视角,很多时候是:
“你把L2做到了99%,确实不错,但它解决的不是我们最怕的那一类问题。”
这就是工业AI在现场“不受欢迎”的真实原因之一:
价值端错配。
你在优化一个“可测可训”的世界,而现场最疼的往往是“不可训、不可标准化”的世界。
三、一个不展开的关键判断:真正的下半场在 L3
我不准备在这篇文章里展开“怎么做”,
但我想抛出三个判断,让大家自己对照:
数据会漂移、会失真(传感器漂移、标定问题、甚至人为修饰)
那么“模型精度”到底反映了什么?它是否等价于“现场可用性”?
重大故障低频、无标签
当训练集不存在时,你的范式还能成立吗?还是只能在 L2 继续卷?
L3 的关键不是答案,而是下一步该看什么
现场最稀缺的不是“一个结论”,而是:
在不确定性里,下一步去采什么、看什么、验证什么,才能最快逼近原因。
如果一个工业AI系统不能在 L3 给出“可验证的下一步”,它就很难成为刚需。
所以我想
我们可以继续把 L2 做到 99.9%,那也很好;
但如果我们在做工业AI,却从未真正触碰过 L3 ——其实做的更像是“工业数据算法”,而不是“工业AI”。