活动地址:CSDN21天学习挑战赛
前言
人工智能
人工智能:为机器赋予人的智能
机器学习
机器学习:一种实现人工智能的方法.
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
机器学习是人工智能的核心
,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合
而不是演绎
。
机器学习最基本的做法,是使用算法来解析数据
、从中学习
,然后对真实世界中的事件做出决策
和预测
。
机器学习算法是一类从数据中自动分析获得规律
,并利用规律对未知数进行预测
的算法。
机器学习按照学习方式
可以分为
- 监督学习
- 分类
- 回归
- 无监督学习
- 强化学习
通俗的来说,机器学习是一门讨论各式各样的适用于不同问题的函数形式,以及如何使用数据来有效的获取函数参数具体指的学科。
机器学习按算法的种类分类
机器学习主要有三大类:
- 分类
- 回归
- 聚类
分类
分类是一种基于一个或多个自变量确定因变量所属类别的技术。
分类的例子包括垃圾邮件检测、客户流失预测、情感分析、犬种检测等
回归
回归是用于估计两个变量之间关系的统计过程。具体而言,回归有两个重要组成部分:自变量和因变量的关系,以及不同自变量对因变量影响的强度。
回归算法的优势在于简单直接、训练速度快,而主要缺陷是要求严格的假设、需要处理异常值。
回归的例子包括房价预测、股价预测、身高-体重预测等。
常见回归算法主要分为以下七类:1. 线性回归 2. 逻辑回归 3. 多项式回归 4. 逐步回归 5. Lasso回归 6. 岭回归 7. ElasticNet回归
聚类
聚类是一种机器学习技术,它涉及到数据点的分组。给定一组数据点,我们可以使用聚类算法将每个数据点划分为一个特定的组。理论上,同一组中的数据点应该具有相似的属性和/或特征,而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法,是许多领域中常用的统计数据分析技术。
监督学习、无监督学习和强化学习
监督学习
监督学习:给一组数据,这组数据,有输入和输出的正确答案。再通过其他输入得到一组新的输出。
应用场景:
- 房价预测
- 股价预测、身高-体重预测
无监督学习
无监督学习:就是给你一组数据,但是不知道数据的任何"正确答案"。在给算法输入一组数据后,算法会在这组数据中找出不同的结构。
应用场景:
- 管理集群,找出哪些机器倾向于协同合作,将这些机器放在一起,可以大大提高集群工作的效率。
- 用于社交网络的分析,知道哪些朋友用email联系的多,你的facebook的朋友等,知道了这些之后,我们可以自动分析出哪些是十分要好的朋友组,哪些是互相认识的朋友组。
- 许多公司拥有大量的客户信息数据库,给你一个客户数据集,你能否自动找出不同的市场分割,将客户细分到不同的细分市场中,从而有助于在不同的细分市场中进行更加有效的营销,我们有这些客户数据,但是我们不知道有哪些细分市场,而且对于数据集的某个客户,我们预先也不知道他们属于哪个细分市场,我们必须让算法自己去数据中发现这一切。
- 无监督学习也被用于天文数据分析。
强化学习
强化学习:强化学习的本质是解决做决定的问题,即自动进行决策,并且可以做连续决策。它主要包含四个元素,agent,环境状态,行动,奖励,强化学习的目标就是获得最多的累计奖励。agent是智能体,环境状态是当前环境的情况,行动是智能体在当前情况下可以采取的所有可能的行动,奖励就是环境的即时返回值,以评估智能体的上一个动作。
你一定看到过人工智能AlphaGO战胜了世界围棋冠军李世石的新闻,而人工智能AlphaGO就是使用了强化学习。
应用场景:
- 机器人、机械臂控制、视频游戏(CNN获取图像信息,提取特征信息等处理),无人驾驶等
- 文本序列预测,机器翻译等
机器学习模型
机器学习模型是一种算法的表达,它通过梳理海量数据来查找模式或进行预测。机器学习 (ML) 模型由数据助力,是人工智能的数学引擎。
例如,适用于计算机视觉的 ML 模型能够在实时视频中识别汽车和行人。适用于自然语言处理的 ML 模型则能够翻译单词和句子。
究其原理,机器学习模型是对象及其相互关系的数学表示。这些对象可以是任何东西,可以是任何社交网络帖子上的“赞”,也可以使是实验室实验中的分子。
深度学习
深度学习:一种实现机器学习的技术
机器学习同深度学习之间是有区别的,机器学习是指计算机的算法能够像人一样,从数据中找到信息,从而学习一些规律。虽然深度学习是机器学习的一种,但深度学习是利用深度的神经网络,将模型处理得更为复杂,从而使模型对数据的理解更加深入。
深度学习是机器学习中一种基于对数据进行表征学习的方法。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分。不同的学习框架下建立的学习模型很是不同。例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。
浅层学习和深度学习
浅层学习
:
在神经网络中含有一个隐层的就叫做多层感知机,也叫神经网络,这种模型就叫做浅层模型。在这种模型中,人们可以用强于人工规则的统计学习方法。20世纪90年代,各种各样的浅层机器学习模型被提出,比如,支持向量机
,Boosting
,最大熵法
。
而在深度学习
中,不止有一层隐藏层,所以在特征的选取
、隐层的确定
、单层训练
、回归训练
等方面都有很多理论和应用难题。
神经网络
神经网络:一种机器学习的算法
神经网络在设计的时候就是模仿人脑的处理方式,希望其可以按人类大脑的逻辑运行(尽管目前来说对人脑的研究仍不够透彻)。神经网络已经有很多年的历史,但现在基本很少听到了。
神经网络和深度神经网络
卷积神经网络
卷积神经网络CNN
CNN核心思想:
CNN模型限制参数了个数并挖掘了局部结构。主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。局部感受视野,权值共享以及时间或空间亚采样这三种思想结合起来,获得了某种程度的位移、尺度、形变不变性。通过“卷积核”作为中介。同一个卷积核在所有图像内是共享的,图像通过卷积操作后仍然保留原先的位置关系。
CNN实质:
CNN在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。
人工智能 机器学习 深度学习 神经网络 之间的关系
数据挖掘
数据分析
数据分析步骤如下:
- 获取数据,查看信息轮廓
- 数据清洗,特征提取
- 建立模型
- 模型训练
- 模型评估
- 预测数据
总结
参考链接: