AI 初学者入门指南:深度学习的五级分类

简介:

目前 AI 被笼统划分为“弱人工智能”、“强人工智能”、“超人工智能”三个类别。甚至在很多业内专家(比如洪小文)眼中,只有“强”、“弱”AI 的区别,因为“超人工智能”离我们实在还很远,难以捉摸。这样的笼统分类显然不利于大众对于各项 AI 技术进行认识和理解。因此,一些专家开始提出基于技术难度和 AI 智能水平的分类、分级方法。

其中,美国学者 Arend Hintze 提出了对 AI 的四级分类, 而最近,Intuition Machine 联合创始人 Carlos Perez 又提出了针对深度学习的五级分类。这些分类方法对各层次 AI 技术进行了简单的归类,有助于初学者更好地认识 AI 。

上个月,密歇根州立大学副教授 Arend Hintze 发表了一篇很有价值的短文章《理解 AI 的四种类别:从响应式机器到有自我意识的存在》( “Understanding the four types of AI, from reactive robots to self-aware beings” )。文中,他提出了对 AI 的四级分类:

响应式

这是最基本的 AI 类型,无法产生记忆,不能利用过去的经验做决策。它们是“专才”而非“通才”,为完成特定任务所设计,不能胜任其他任务。

有限记忆

当前行为能够参考刚刚发生的事件。但记忆是瞬时的——无法用于未来决策。

心智理论( Theory of mind)

这是一个心理学术语,意思是能根据他人行为,推导、并理解他们的想法和动机。这一类型的 AI 能够归纳出周围环境、和与之交互的其他代理的“表征”( representations,AI 术语,详见“表示学习”)。

自我意识

AI 的终极课题。目前对于它的描述大都是猜想。

对此,AI 专家 Carlos Perez 表示,他喜欢这个四分类法远远超过目前广泛使用的“强人工智能 vs 弱人工智能”二分类法(ps:或者再加上“超人工智能”成为第三个类别)。Arend Hintze 的方法把弱 AI 分为三个类别(响应式,有限记忆,心智理论),这给了我们更多概念,来区分不同的 AI 应用。但 Carlos Perez 又评论道,该分类法似乎来自于 “GOFAI” 思路(老式 AI),潜台词是它已经过时了;另外,从有限记忆、能够使用部分过去记忆做决策到心智理论,这步子迈得太大了。

于是,Carlos Perez 提出了他自己的 AI 分类方式,按能力把 AI 划分为五个级别。他表示,该分类法主要针对深度学习,希望对 AI 从业者来说更细致、更有用。它能帮我们看清楚 AI 目前在哪个阶段,以及将来会走向何方。

Perez 表示:“对当前 AI 技术进行评估,我们缺少一个好的概念框架。这可能只是由于大多数 AI 评论人无法跟上最新的深度学习进展——需要读的东西太多,而且最新发现不停刷新我们现在对 AI 的理解。”

我们来看看 Perez 针对深度学习能力的 AI 分类:

1. 只能分类的系统(ANNs/DL) Classification Only

该级别包含全连接神经网络( fully connected neural network ,FCN),卷积神经网络(convolution network,CNN)和它们之间的各种组合。这些系统把一个高维度矢量作为输入,得到单个结果,一般是对输入矢量的分类。

你可以把这些系统看成无状态函数,意味着它们的行为只是一个针对当前输入的函数。一个热门研究领域——生成模型,就属于该类别。简单来讲,这些系统凭它们自己是十分强大的。

2. 使用记忆分类的系统 Classification with Memory (CM)

这个级别包含 “C 层”网络中整合的记忆因素。LSTM 就是一个例子:记忆单位嵌入在 LSTM 节点中。其它类似的变形还有,神经图灵机器 (NMT) 和 DeepMind 的可微分神经计算机(DNC)。在对行为进行计算时,这些系统会维持状态恒定。

3. 使用知识分类的系统 Classification with Knowledge (CK)

该级别与 CM 有些相似。但 C 层网络能获取的信息不是原始内存,而是符号化的知识库(symbolic knowledge base)。我们获知,事实上 Carlos Perez 就发现了三种符号化整合:1. 转移学习方式( transfer learning approach);2. 自上而下方式 ;3. 自下而上方式。第一种方式用一个符号化系统作为正则化矩阵(regularizer)。第二种方式在神经表征底层的最上层加入了符号化元素。第三种方式跟这相反,C 层网络直接与符号化知识库关联。

4. 使用有限知识的分类 Classification with Imperfect Knowledge (CIK)

在这个级别,系统直接建立在 CK 之上,但是,它已能够使用不完美的信息做推理。这类系统的代表是 Alpha Go。只是 Alpha Go 采用的不是 CK 而是 CM 级别的能力。正如 Alpha Go,这类系统能通过与自身的对抗模拟来训练自己。

5. 能使用有限知识协作分类的系统 Collaborative Classification with Imperfect Knowledge (CCIK)

这个级别和 Arend Hintze 的“心智理论”类别十分近似,多个代理神经网络联合起来解决问题。这些系统被设计来完成多项目标。我们其实可以在对抗网络中运行它的原始版本:与判别器和生成网络一起学习归纳。在博弈论驱动的、能战略战术性解决多重问题的网络上应用该概念,就能得到高度灵活的系统。但是,我们现在还达不到这个水平,前面那些级别仍需要很多研究来完善。

Perez 五级分类法的根据:

每一层级别,都带来了上个级别没有的新能力。 比方说,C 层系统只能预测反因果关系(anti-causal relationships)。 CM 级别的系统能完成不错的翻译。CIK 级别系统能玩战略游戏。

我们可以看出,除了没有“自我意识”级别,这个分类法和 Hinzte 四级分类高度相似。在这些“基础”级别全部达到之前,Carlos Perez 不准备探讨自我意识。这个分类同样没有提到零样本学习(zero-shot learning)、一步学习(one-shot learning)或者无监督学习。据悉,后者仍然是 AI 基础挑战之一。正如 大牛 Yann LeCun 所形容:

“假设机器学习是一个蛋糕,强化学习是蛋糕上的一粒樱桃,监督学习是外面的一层糖衣,无监督学习则是蛋糕糕体。我们知道怎么做糖衣和樱桃,但不知道怎么把糕体做出来。”

在最近的演讲里,Yann LeCun 开始用预测学习(predictive learning)来替代无监督学习。这是一个很有意思的转变:它展示出 LeCun 在如何做蛋糕这个问题上,观点发生了微妙变化。在他眼里,这是 AI 技术大幅进步所必需的基础。换句话说,在建设好预测学习的地基之前,在现有监督学习的基础上加入更多记忆、知识库、协作代理这些能力会十分困难。

在最近的 NIPS 2016 大会上,LeCun 展示了这幅 PPT:

这列出了 AI 进步的主要障碍:

机器需要学习世界运作的方式

AI 要学习海量背景知识

机器需要能够感知环境的状况

机器需要更新并记忆环境的状况

机器需要学习和计划

智能和常识等于:感知+预测模型+记忆+推理和计划

这些能力在反馈回路里用到时,都利用了加速器技术。我们其实在现在的研究中看到过这类元学习(meta-learning)或是学习优化(learning to optimize)。元学习技术带来的主要启示是:当我们能训练机器找出用其它方法找不出的解决方案,研究方法会变得更强大。


本文作者:佚名

来源:51CTO

相关文章
|
机器学习/深度学习 编解码 人工智能
人脸表情[七种表情]数据集(15500张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
本数据集包含15,500张已划分、已标注的人脸表情图像,覆盖惊讶、恐惧、厌恶、高兴、悲伤、愤怒和中性七类表情,适用于YOLO系列等深度学习模型的分类与检测任务。数据集结构清晰,分为训练集与测试集,支持多种标注格式转换,适用于人机交互、心理健康、驾驶监测等多个领域。
|
25天前
|
机器学习/深度学习 传感器 人工智能
火灾火焰识别数据集(2200张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在人工智能和计算机视觉的快速发展中,火灾检测与火焰识别逐渐成为智慧城市、公共安全和智能监控的重要研究方向。一个高质量的数据集往往是推动相关研究的核心基础。本文将详细介绍一个火灾火焰识别数据集,该数据集共包含 2200 张图片,并已按照 训练集(train)、验证集(val)、测试集(test) 划分,同时配有对应的标注文件,方便研究者快速上手模型训练与评估。
火灾火焰识别数据集(2200张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
|
24天前
|
机器学习/深度学习 人工智能 监控
坐姿标准好坏姿态数据集(图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
坐姿标准好坏姿态数据集的发布,填补了计算机视觉领域在“细分健康行为识别”上的空白。它不仅具有研究价值,更在实际应用层面具备广阔前景。从青少年的健康教育,到办公室的智能提醒,再到驾驶员的安全监控和康复训练,本数据集都能发挥巨大的作用。
坐姿标准好坏姿态数据集(图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
|
28天前
|
机器学习/深度学习 编解码 人工智能
102类农业害虫数据集(20000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在现代农业发展中,病虫害监测与防治 始终是保障粮食安全和提高农作物产量的关键环节。传统的害虫识别主要依赖人工观察与统计,不仅效率低下,而且容易受到主观经验、环境条件等因素的影响,导致识别准确率不足。
|
4月前
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
|
2月前
|
机器学习/深度学习 人工智能 PyTorch
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
本文以 MNIST 手写数字识别为切入点,介绍了深度学习的基本原理与实现流程,帮助读者建立起对神经网络建模过程的系统性理解。
225 15
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
|
4月前
|
人工智能 Java API
Spring AI 实战|Spring AI入门之DeepSeek调用
本文介绍了Spring AI框架如何帮助Java开发者轻松集成和使用大模型API。文章从Spring AI的初探开始,探讨了其核心能力及应用场景,包括手动与自动发起请求、流式响应实现打字机效果,以及兼容不同AI服务(如DeepSeek、通义千问)的方法。同时,还详细讲解了如何在生产环境中添加监控以优化性能和成本管理。通过Spring AI,开发者可以简化大模型调用流程,降低复杂度,为企业智能应用开发提供强大支持。最后,文章展望了Spring AI在未来AI时代的重要作用,鼓励开发者积极拥抱这一技术变革。
1537 71
Spring AI 实战|Spring AI入门之DeepSeek调用
|
机器学习/深度学习 人工智能 文字识别
中药材图像识别数据集(100类,9200张)|适用于YOLO系列深度学习分类检测任务
本数据集包含9200张中药材图像,覆盖100类常见中药材,适用于YOLO系列及主流深度学习模型的图像分类与目标检测任务。数据已划分为训练集(8000张)与验证集(1200张),采用标准文件夹结构和简体中文命名,适配PyTorch、TensorFlow等框架,可用于中药识别系统开发、医学辅助诊断、移动端图像识别App研发及AI科研训练,具备较强的实用性与拓展性。
469 44
|
28天前
|
机器学习/深度学习 自动驾驶 算法
道路表面缺陷数据集(裂缝/井盖/坑洼)(6000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
随着城市化与交通运输业的快速发展,道路基础设施的健康状况直接关系到出行安全与城市运行效率。长期高强度的使用、气候变化以及施工质量差异,都会导致道路表面出现裂缝、坑洼、井盖下沉及修补不良等缺陷。这些问题不仅影响驾驶舒适度,还可能引发交通事故,增加道路养护成本。
道路表面缺陷数据集(裂缝/井盖/坑洼)(6000张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 基础知识从 0.3 到 0.4——如何选对深度学习模型?
本系列文章从机器学习基础出发,逐步深入至深度学习与Transformer模型,探讨AI关键技术原理及应用。内容涵盖模型架构解析、典型模型对比、预训练与微调策略,并结合Hugging Face平台进行实战演示,适合初学者与开发者系统学习AI核心知识。
238 15

热门文章

最新文章