“啤酒尿布”模型管用,说不清因果又怎样?

简介: 好的模型,为什么非得是人能够理解的?有的人,对深度学习(deep learning)模型,很不以为然。说根本没有搞清楚因果关系,只是拿出相关性来说事儿。
img_c60226342e5f478a138fd2376a36e295.jpe

好的模型,为什么非得是人能够理解的?

有的人,对深度学习(deep learning)模型,很不以为然。

说根本没有搞清楚因果关系,只是拿出相关性来说事儿。

尤其是模型无法清楚解释——即不能像牛顿力学一样,用简单优美的数学公式刻画。

img_fb24ed19d0b4ebfb93218c401125318f.jpe

奇怪,为什么模型一定要简单到清清楚楚?

复杂系统已经被研究了这么多年,却还有人恨不得回归前信息化时代。

img_883c9273c2c8c0214243a2f9ea5723e3.jpe

总不能因为你只学过文科班高中物理,就得让全世界的科学研究退回到1800年之前吧?

人是通过大脑,对信息进行加工的。

连这个加工工具,至今都没有完全搞清楚,不是吗?

img_d05177539222155954186920c5c016ee.png

那为何要对机器们在大数据上,辛辛苦苦构造出的模型,如此苛刻?

一个模型,可以准确做分类预测。而且反复在新的、没有训练的数据上尝试过,好用,那不就好了?

虽然不能排除纯是因为运气,但是这种可能概率很小。

img_58d7055309b6e07b164994dd19f14f5e.jpe

好的模型,为什么非得是人能够理解的?

人对于宏观世界,至今缺乏理解。大爆炸只是假说。

人对于微观世界,同样缺乏理解。什么叫“测不准”来着?

人对于暗物质,意见不一。找不到证据,成为了“最好的证据”。

人连时间是什么,还说不清楚。要不然哪儿来的这么多穿越剧?

那凭什么,一个好用的模型,只是因为层数多、结构复杂、无法用数学语言解释给听众,就被鄙视?

img_dfe4eaaa4450e2b58b38c5fe82f918c0.png

其实原因也不难理解。

都在于人类社会协作中的共识。

img_0069d7d8485db13bd17cd21e0d2e9b20.jpe

大家都认同的,很有价值。

例如美元、黄金和一线城市的房地产。

极少数人才认同的,价值没有这么高。

例如2012年的比特币。

img_1dae1fe5334fad732601977afd00f209.png

大部分人都无法理解,自然难以达成共识。

这时候有人出来批评复杂模型,看不懂的人就觉得很爽。

看,我不理解的东西,就一定是不靠谱的,哈哈。

站队的结果,就是大部分连讨论对象是啥,都没有搞清楚的人,跟随主流意见,人云亦云而已。

然而……

共识是会发生变化的,即所谓“范式转移”嘛。

img_8bd81534a8064c282fac48ca0c9cb83a.jpe

喜欢请点赞。还可以微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)

如果你对数据科学感兴趣,不妨阅读我的系列教程索引贴《如何高效入门数据科学?》,里面还有更多的有趣问题及解法。

目录
相关文章
|
搜索推荐
ICDE 2023 | DCMT:基于因果纠偏的直接全空间多任务转化率预测模型
ICDE 2023 | DCMT:基于因果纠偏的直接全空间多任务转化率预测模型
1750 0
ICDE 2023 | DCMT:基于因果纠偏的直接全空间多任务转化率预测模型
|
3天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
271 116
|
18天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
12天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
663 219
|
5天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
360 34
Meta SAM3开源:让图像分割,听懂你的话
|
10天前
|
人工智能 移动开发 自然语言处理
2025最新HTML静态网页制作工具推荐:10款免费在线生成器小白也能5分钟上手
晓猛团队精选2025年10款真正免费、无需编程的在线HTML建站工具,涵盖AI生成、拖拽编辑、设计稿转代码等多种类型,均支持浏览器直接使用、快速出图与文件导出,特别适合零基础用户快速搭建个人网站、落地页或企业官网。
1592 157
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
897 61