深度学习中,还有这15个未解难题

简介:
本文来自AI新媒体量子位(QbitAI)

认脸、翻译、合成语音……深度学习在很多问题上都取得了非常好的成绩。

那么,还有什么问题不能用深度学习来解决呢?

斯坦福大学在读博士Bharath Ramsundar列出了下面16个方面,希望能对今后的算法开发有所帮助。

量子位翻译了这篇文章,以下为译文。

1.众所周知,深度学习方法很难学习到输入样本的微小变化。当样本的颜色交换时,所构建的目标识别系统可能会完全崩溃。

2.基于梯度的网络训练过程相当缓慢。一般按照固定模式来实现多种梯度下降方法,但是这种方法很难用于高维数据的预测。

3.深度学习方法在处理条件约束方面的效果也不佳,不能像线性规划方法那样,能快速找到满足约束的解决方案。

4.在训练复杂模型时,网络相当不稳定。通常不能很好地训练神经图灵机和GAN网络,严重依赖网络的初始化方式。

5.深层网络能较好地应用于图像处理和自然语言分析中,但是不适合现实世界的实际问题,如提取因果结构等等。

6.在实际应用中,要考虑关键影响者检测的问题。在参议员投票的数据集中,应该如何检测出关键影响者,深度神经网络DNN还不能应用于此方面。

7.强化学习(Reinforcement learning)方法对输入数据非常挑剔,实际性能主要取决于调参技巧,虽然这个特殊问题仅存在于这个方面。

8.深度学习方法不容易理解未知实体,比如说当棒球击球手在视频中,深度学习不知道如何推断出屏幕外还有个投手。

9.实时训练深层网络几乎不可能,因此很难进行动态调整,上文已经提到网络训练缓慢的问题。

10.一般来说,网络需通过离线训练后才能进行智能辨识。

11.人们经常提出一些对深层网络的理论解释。但这可能不是一个大问题,人们才是一个真正的大问题。

12.目前很难确定深层网络学习到了什么。作为工程师的我们,怎样才能确保在网络训练过程中不存在偏见和种族歧视?

13.深度神经网络很难用来解决逻辑问题。3SAT求解器具有很强的能力,但是很难应用到深层网络。

14.深度神经网络在处理大维度的特征数据方面效果不佳。这种方法与强大的随机森林方法不同,在训练前需要大量的特征调整。

15.深度网络的超参数优化研究仍然处于起步阶段。研究者需要完成大量的计算或是手动调整许多网络结构。

以上这些并不是一个完整的列表,但是我觉得这些都是值得思考的问题。在这些问题的基础上,要思考:

这些问题是深层神经网络本身存在的问题,还是要被克服的工程挑战?

这些都很难说,其中的一些问题可能会得到解决,比如更多性能优秀的硬件被开发用于超参数自动搜索。有一些早期结构可以用来自动归一化和处理大维度的特征数据,因此处理特征的问题可能有所改善。

然而,逻辑、约束、隐藏结构和网络审查等问题可能会进行更深入地研究。我很愿意看到大家对这些问题提出质疑,深度学习的研究者通常都是很有才华和有想象力的。摩尔定律仍然适用于GPU性能曲线,TPU和定制硬件还需要多久才能上市?

所以我对这些挑战持乐观态度。尽管如此,我还是怀疑深度神经网络不足以实现通用人工智能,当然,这可能只是我的偏见,事件上的专家可能是预测上的菜鸟,我们花了太多时间钻研技术。

千万不要只知其然,而不知其所以然!

我不想把这个随笔写成一篇文章,不确定是否有未知的主题还未被列出。

最后,作者还说,把这篇随笔送给聪明的读者。

【完】

本文作者:王小新 
原文发布时间:2017-06-22
相关文章
|
机器学习/深度学习 安全
一文读懂分类模型评估指标
模型评估是深度学习和机器学习中非常重要的一部分,用于衡量模型的性能和效果。本文将逐步分解混淆矩阵,准确性,精度,召回率和F1分数。
1183 1
|
Kubernetes API 调度
Kubernetes 架构解析:理解其核心组件
【8月更文第29天】Kubernetes(简称 K8s)是一个开源的容器编排系统,用于自动化部署、扩展和管理容器化应用。它提供了一个可移植、可扩展的环境来运行分布式系统。本文将深入探讨 Kubernetes 的架构设计,包括其核心组件如何协同工作以实现这些功能。
1224 3
|
SQL druid 搜索推荐
大数据分析-常见分布式OLAP查询引擎研究
通用大数据分析OLAP引擎的粗浅研究学习-更新中
1163 0
大数据分析-常见分布式OLAP查询引擎研究
汉诺塔+小青蛙跳台阶---《递归》
汉诺塔+小青蛙跳台阶---《递归》
406 0
|
Kubernetes 监控 Cloud Native
OpenKruise :SidecarSet 助力 Mesh 容器热升级
SidecarSet 基于上一个版本扩展了特别针对 Service Mesh 场景的支持。
OpenKruise :SidecarSet 助力 Mesh 容器热升级
|
1天前
|
云安全 人工智能 运维
阿里云SecOps Agent,全新安全跨产品执行体验
自然语言驱动 云安全中心/WAF/CFW/ 等多款安全产品联动
1570 1
|
12天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
12天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
855 11
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图