万能近似定理：神经网络为什么什么都能学？

2026-04-20 26

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： # 万能近似定理：神经网络为什么什么都能学？## 从一道题说起> **建造一个多层神经网络，可实现逼近一个任意的（）。**

万能近似定理：神经网络为什么什么都能学？

从一道题说起

建造一个多层神经网络，可实现逼近一个任意的（）。

A. 函数 B. 连续函数 C. 只有有限个间断点的连续函数

答案是 B. 连续函数。

这道题考的是一个叫"万能近似定理"的东西。名字听起来很厉害，其实道理特别简单。

一、一句话解释

给神经网络足够多的"脑细胞"，它就能学会画任何不间断的曲线。

就这么简单。

二、用一个例子看懂

场景：让 AI 学画波浪线

假设你要教 AI 画正弦曲线（就是那种上下起伏的波浪线）：

你怎么教？

方法 1：给规则

告诉 AI "sin(x) 的公式是……"——这是传统编程的做法。

方法 2：给例子

给 AI 看很多点：(0, 0)、(0.5, 0.48)、(1, 0.84)……让它自己找规律——这就是神经网络的做法。

神经网络怎么学的？

想象你有 100 个工人，每人手里有一支笔：

工人 1 画一条很淡的线
工人 2 画另一条很淡的线
……
100 条线叠加在一起 → 就变成了你想要的波浪线

每个工人 = 一个神经元

每条线 = 神经元的输出

叠加 = 神经网络的最终输出

工人越多，画得越像。这就是"万能近似"的意思。

三、为什么是"连续函数"？

连续 vs 不连续

连续函数 = 一笔画出来的线，中间不断开

不连续函数 = 中间有跳跃、断开的线

神经网络为什么只能处理连续的邀请码？

因为神经网络的每一层都在做同一件事：

输入 → 乘以一个数 → 加上一个数 → 输出

这个操作天生就是"连续"的——输入稍微变一点，输出也只会稍微变一点，不会突然跳变。

连续的步骤叠加，结果还是连续的。

所以神经网络天生适合处理连续的东西，处理不了突然跳跃的东西。

四、回到那道题

现在再看三个选项：

A. "函数"——错了

函数包括连续和不连续的
神经网络搞不定不连续的

C. "只有有限个间断点的连续函数"——太复杂了

加了多余的限制条件
标准答案没这么说

B. "连续函数"——对了

不多不少，刚好
这就是定理的原话

五、这有什么用？

这个定理告诉我们：神经网络理论上可以学会任何连续的映射关系。

所以它能：

看图识物（像素 → 物体名称）
语音转文字（声音 → 文字）
翻译语言（中文 → 英文）
预测股票（历史数据 → 未来价格）

本质上都是在"画一条曲线"，只不过这条曲线可能有几百万个维度。

六、记住一句话

考试遇到这类题，记住这句就够了：

"神经网络 + 足够多层 = 可以拟合任何连续函数"

关键词就两个：连续、足够多。

万能近似定理：神经网络为什么什么都能学？

万能近似定理：神经网络为什么什么都能学？

从一道题说起

一、一句话解释