人工智能(Artificial Intelligence),简称AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
作为计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人工智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程进行模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
众所周知,人工智能领域知识庞大且复杂,各种专业名词层出不穷,常常让初学者看得摸不着头脑。“机器学习”、“深度学习”、“强化学习”就属于这类名词。那么,针对这三者各自具体有哪些内容?三者是否有相关性?不同核心及侧重点是什么?以及各自的应用领域有哪些?应用的前景如何?等问题,本文将进行详细的阐述。
一、机器学习是人工智能的子领域
人工智能就是让机器能够像人类一样思考。通常将人工智能分为弱人工智能和强人工智能,弱人工智能让机器具备观察和感知的能力,可以做到一定程度的理解和推理;而强人工智能让机器获得自适应能力,解决一些之前没有遇到的问题。
很多外行人会简单地误以为“机器学习就是人工智能,人工智能就是机器学习。”为什么呢?这主要是因为目前“机器学习”是人工智能的一个大方向,且在AI中处于核心地位。
根据定义,机器学习的研究旨在让计算机学会学习,能够模拟人类的学习行为,建立学习能力,实现识别和判断。机器学习最基本的做法就是使用算法来解析海量数据,从中找出规律,用学习出来的思维模型对真实事件做出决策和预测。
二、什么是机器学习
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能中最具智能特征,最前沿的研究领域之一。自20世纪80年代以来,机器学习作为实现人工智能的途径,在人工智能界引起了广泛的兴趣,特别是近十几年来,机器学习领域的研究工作发展很快,它已成为人工智能的重要课题之一。机器学习不仅在基于知识的系统中得到应用,而且在自然语言理解、非单调推理、机器视觉、模式识别等许多领域也得到了广泛应用。一个系统是否具有学习能力已成为是否具有“智能”的一个标志。机器学习的研究主要分为两类研究方向:第一类是传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制;第二类是大数据环境下机器学习的研究,该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。
机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等。传统的机器学习算法已经能够满足指纹识别、人脸检测等商业化水平,但大多数识别任务要经过手工特征提取和分类器判断两个基本步骤,随着数据量的不断增大,之后人工智能领域的前进就需要依靠深度学习的相关技术与知识。
三、深度学习是一种实现机器学习的技术
深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
区别于传统的浅层学习,深度学习的不同在于: 1、强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点。2、明确了特征学习的重要性。也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据丰富的内在信息。
典型的深度学习模型有卷积神经网络( convolutional neural network)、DBN和堆栈自编码网络(stacked auto-encoder network)模型等,在这里,就不对这些模型进行描述了。
深度学习在搜索技术、数据挖掘、机器学习、机器翻译、计算机视觉、语音识别、自然语言处理、多媒体学习、语音、推荐和个性化技术、以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
但凡有关提到人工智能的产业报道,必然离不开深度学习。比如,2016年战胜人类顶尖围棋选手的AlphaGo,其主要原理就是“深度学习”。同时,深度学习也使几乎所有的机器辅助功能都变为可能,如无人驾驶汽车、预防性医疗保健等。
四、强化学习
强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。
强化学习的常见模型是标准的马尔可夫决策过程。按给定条件,强化学习可分为基于模式的强化学习和无模式强化学习。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习。
强化学习理论受到行为主义心理学启发,侧重在线学习并试图在探索-利用间保持平衡。不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。
强化学习是另外一种重要的机器学习方法,强调如何基于环境而行动,以取得最大化的预期利益。强化学习和深度学习的主要区别在于:1、相比深度学习,强化学习的训练不需要标签,它通过环境给出的奖惩来学习。2、深度学习的学习过程是静态的,强化学习则是动态的,动态体现在是否会与环境进行交互。也就是说,深度学习是给什么样本就学什么,而强化学习是要和环境进行交互,再通过环境给出的奖惩来学习。3、深度学习解决的更多是感知问题,强化学习解决的主要是决策问题。因此有监督学习更像是五官,而强化学习更像大脑的说法。但是深度学习和强化学习之间并不是泾渭分明,它们之间可以相互组合,比如在强化学习系统中使用深度学习(深度强化学习)等等。
强化学习问题在信息论、博弈论、自动控制等领域有得到讨论,被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能,可以在围棋和电子游戏中达到人类水平。
综上所述,从整体范围大致来看:AI>机器学习(ML)>深度学习>强化学习。人工智能的根本在于智能,而机器学习则是部署支持人工智能的计算方法。简单的来说,人工智能是科学,机器学习是让机器变得更加智能的算法,机器学习在某种程度上成就了人工智能。深度学习是实现机器学习的一种技术。所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,由于外部给出的信息很少,强化学习系统必须依靠自身的经历进行自我学习。通过这种学习获取知识,改进行动方案以适应环境。