AI 初学者入门指南:深度学习的五级分类

简介:

目前 AI 被笼统划分为“弱人工智能”、“强人工智能”、“超人工智能”三个类别。甚至在很多业内专家(比如洪小文)眼中,只有“强”、“弱”AI 的区别,因为“超人工智能”离我们实在还很远,难以捉摸。这样的笼统分类显然不利于大众对于各项 AI 技术进行认识和理解。因此,一些专家开始提出基于技术难度和 AI 智能水平的分类、分级方法。

其中,美国学者 Arend Hintze 提出了对 AI 的四级分类, 而最近,Intuition Machine 联合创始人 Carlos Perez 又提出了针对深度学习的五级分类。这些分类方法对各层次 AI 技术进行了简单的归类,有助于初学者更好地认识 AI 。

上个月,密歇根州立大学副教授 Arend Hintze 发表了一篇很有价值的短文章《理解 AI 的四种类别:从响应式机器到有自我意识的存在》( “Understanding the four types of AI, from reactive robots to self-aware beings” )。文中,他提出了对 AI 的四级分类:

响应式

这是最基本的 AI 类型,无法产生记忆,不能利用过去的经验做决策。它们是“专才”而非“通才”,为完成特定任务所设计,不能胜任其他任务。

有限记忆

当前行为能够参考刚刚发生的事件。但记忆是瞬时的——无法用于未来决策。

心智理论( Theory of mind)

这是一个心理学术语,意思是能根据他人行为,推导、并理解他们的想法和动机。这一类型的 AI 能够归纳出周围环境、和与之交互的其他代理的“表征”( representations,AI 术语,详见“表示学习”)。

自我意识

AI 的终极课题。目前对于它的描述大都是猜想。

对此,AI 专家 Carlos Perez 表示,他喜欢这个四分类法远远超过目前广泛使用的“强人工智能 vs 弱人工智能”二分类法(ps:或者再加上“超人工智能”成为第三个类别)。Arend Hintze 的方法把弱 AI 分为三个类别(响应式,有限记忆,心智理论),这给了我们更多概念,来区分不同的 AI 应用。但 Carlos Perez 又评论道,该分类法似乎来自于 “GOFAI” 思路(老式 AI),潜台词是它已经过时了;另外,从有限记忆、能够使用部分过去记忆做决策到心智理论,这步子迈得太大了。

于是,Carlos Perez 提出了他自己的 AI 分类方式,按能力把 AI 划分为五个级别。他表示,该分类法主要针对深度学习,希望对 AI 从业者来说更细致、更有用。它能帮我们看清楚 AI 目前在哪个阶段,以及将来会走向何方。

Perez 表示:“对当前 AI 技术进行评估,我们缺少一个好的概念框架。这可能只是由于大多数 AI 评论人无法跟上最新的深度学习进展——需要读的东西太多,而且最新发现不停刷新我们现在对 AI 的理解。”

我们来看看 Perez 针对深度学习能力的 AI 分类:

1. 只能分类的系统(ANNs/DL) Classification Only

该级别包含全连接神经网络( fully connected neural network ,FCN),卷积神经网络(convolution network,CNN)和它们之间的各种组合。这些系统把一个高维度矢量作为输入,得到单个结果,一般是对输入矢量的分类。

你可以把这些系统看成无状态函数,意味着它们的行为只是一个针对当前输入的函数。一个热门研究领域——生成模型,就属于该类别。简单来讲,这些系统凭它们自己是十分强大的。

2. 使用记忆分类的系统 Classification with Memory (CM)

这个级别包含 “C 层”网络中整合的记忆因素。LSTM 就是一个例子:记忆单位嵌入在 LSTM 节点中。其它类似的变形还有,神经图灵机器 (NMT) 和 DeepMind 的可微分神经计算机(DNC)。在对行为进行计算时,这些系统会维持状态恒定。

3. 使用知识分类的系统 Classification with Knowledge (CK)

该级别与 CM 有些相似。但 C 层网络能获取的信息不是原始内存,而是符号化的知识库(symbolic knowledge base)。我们获知,事实上 Carlos Perez 就发现了三种符号化整合:1. 转移学习方式( transfer learning approach);2. 自上而下方式 ;3. 自下而上方式。第一种方式用一个符号化系统作为正则化矩阵(regularizer)。第二种方式在神经表征底层的最上层加入了符号化元素。第三种方式跟这相反,C 层网络直接与符号化知识库关联。

4. 使用有限知识的分类 Classification with Imperfect Knowledge (CIK)

在这个级别,系统直接建立在 CK 之上,但是,它已能够使用不完美的信息做推理。这类系统的代表是 Alpha Go。只是 Alpha Go 采用的不是 CK 而是 CM 级别的能力。正如 Alpha Go,这类系统能通过与自身的对抗模拟来训练自己。

5. 能使用有限知识协作分类的系统 Collaborative Classification with Imperfect Knowledge (CCIK)

这个级别和 Arend Hintze 的“心智理论”类别十分近似,多个代理神经网络联合起来解决问题。这些系统被设计来完成多项目标。我们其实可以在对抗网络中运行它的原始版本:与判别器和生成网络一起学习归纳。在博弈论驱动的、能战略战术性解决多重问题的网络上应用该概念,就能得到高度灵活的系统。但是,我们现在还达不到这个水平,前面那些级别仍需要很多研究来完善。

Perez 五级分类法的根据:

每一层级别,都带来了上个级别没有的新能力。 比方说,C 层系统只能预测反因果关系(anti-causal relationships)。 CM 级别的系统能完成不错的翻译。CIK 级别系统能玩战略游戏。

我们可以看出,除了没有“自我意识”级别,这个分类法和 Hinzte 四级分类高度相似。在这些“基础”级别全部达到之前,Carlos Perez 不准备探讨自我意识。这个分类同样没有提到零样本学习(zero-shot learning)、一步学习(one-shot learning)或者无监督学习。据悉,后者仍然是 AI 基础挑战之一。正如 大牛 Yann LeCun 所形容:

“假设机器学习是一个蛋糕,强化学习是蛋糕上的一粒樱桃,监督学习是外面的一层糖衣,无监督学习则是蛋糕糕体。我们知道怎么做糖衣和樱桃,但不知道怎么把糕体做出来。”

在最近的演讲里,Yann LeCun 开始用预测学习(predictive learning)来替代无监督学习。这是一个很有意思的转变:它展示出 LeCun 在如何做蛋糕这个问题上,观点发生了微妙变化。在他眼里,这是 AI 技术大幅进步所必需的基础。换句话说,在建设好预测学习的地基之前,在现有监督学习的基础上加入更多记忆、知识库、协作代理这些能力会十分困难。

在最近的 NIPS 2016 大会上,LeCun 展示了这幅 PPT:

这列出了 AI 进步的主要障碍:

机器需要学习世界运作的方式

AI 要学习海量背景知识

机器需要能够感知环境的状况

机器需要更新并记忆环境的状况

机器需要学习和计划

智能和常识等于:感知+预测模型+记忆+推理和计划

这些能力在反馈回路里用到时,都利用了加速器技术。我们其实在现在的研究中看到过这类元学习(meta-learning)或是学习优化(learning to optimize)。元学习技术带来的主要启示是:当我们能训练机器找出用其它方法找不出的解决方案,研究方法会变得更强大。


本文作者:佚名

来源:51CTO

相关文章
|
11天前
|
机器学习/深度学习 人工智能 PyTorch
PyTorch深度学习 ? 带你从入门到精通!!!
🌟 蒋星熠Jaxonic,深度学习探索者。三年深耕PyTorch,从基础到部署,分享模型构建、GPU加速、TorchScript优化及PyTorch 2.0新特性,助力AI开发者高效进阶。
PyTorch深度学习 ? 带你从入门到精通!!!
|
2天前
|
存储 人工智能 自然语言处理
AI大模型入门 七 核心概念深度解析:参数量、Token、上下文窗口、上下文长度与温度
本文深入解析大模型五大核心概念:参数量、Token、上下文窗口、上下文长度与温度,图解其作用与影响,助你掌握模型设计与优化关键,提升AI应用效能。
|
1月前
|
存储 人工智能 测试技术
手把手带你入门AI智能体:从核心概念到第一个能跑的Agent
AI智能体是一种能感知环境、自主决策并执行任务的人工智能系统。它不仅能生成回应,还可通过工具使用、计划制定和记忆管理完成复杂工作,如自动化测试、脚本编写、缺陷分析等。核心包括大语言模型(LLM)、任务规划、工具调用和记忆系统。通过实践可逐步构建高效智能体,提升软件测试效率与质量。
|
2月前
|
人工智能 数据可视化 安全
Dify入门系列(1)| Dify 是什么?真能开启低代码 AI 应用开发?
Dify 是一个融合 BaaS 与 LLMOps 的开源平台,通过可视化编排、预置组件与企业级引擎,帮助企业快速、安全、低成本地构建 AI 应用。无论是客服机器人还是复杂业务流程,Dify 都能将开发周期从数周缩短至分钟级,推动低代码 AI 开发进入实用阶段。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AI概念解析:从入门到精通的43个关键术语指南
本文系统梳理AI领域50个核心术语,涵盖基础概念、技术原理、应用场景与合规风险,帮助读者精准理解AI本质,把握技术演进脉络与产业趋势,提升智能时代认知与决策能力。
|
23天前
|
敏捷开发 人工智能 自动驾驶
AI大模型入门第四篇:借助RAG实现精准用例自动生成!
测试开发是否总被用例维护、漏测风险和文档滞后困扰?RAG技术让AI实时解读最新需求,自动生成精准测试用例,动态对齐线上数据,节省70%维护成本,助你告别手工“填坑”,高效应对需求变化。
|
2月前
|
机器学习/深度学习 人工智能 监控
河道塑料瓶识别标准数据集 | 科研与项目必备(图片已划分、已标注)| 适用于YOLO系列深度学习分类检测任务【数据集分享】
随着城市化进程加快和塑料制品使用量增加,河道中的塑料垃圾问题日益严重。塑料瓶作为河道漂浮垃圾的主要类型,不仅破坏水体景观,还威胁水生生态系统的健康。传统的人工巡查方式效率低、成本高,难以满足实时监控与治理的需求。
|
2月前
|
机器学习/深度学习 传感器 人工智能
火灾火焰识别数据集(2200张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在人工智能和计算机视觉的快速发展中,火灾检测与火焰识别逐渐成为智慧城市、公共安全和智能监控的重要研究方向。一个高质量的数据集往往是推动相关研究的核心基础。本文将详细介绍一个火灾火焰识别数据集,该数据集共包含 2200 张图片,并已按照 训练集(train)、验证集(val)、测试集(test) 划分,同时配有对应的标注文件,方便研究者快速上手模型训练与评估。
火灾火焰识别数据集(2200张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
|
2月前
|
机器学习/深度学习 人工智能 自动驾驶
7种交通场景数据集(千张图片已划分、已标注)|适用于YOLO系列深度学习分类检测任务【数据集分享】
在智能交通与自动驾驶技术快速发展的今天,如何高效、准确地感知道路环境已经成为研究与应用的核心问题。车辆、行人和交通信号灯作为城市交通系统的关键元素,对道路安全与交通效率具有直接影响。然而,真实道路场景往往伴随 复杂光照、遮挡、多目标混杂以及交通信号状态多样化 等挑战,使得视觉识别与检测任务难度显著增加。

热门文章

最新文章