机器学习概述(三)

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 机器学习概述(三)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):机器学习概述(三)】

课程地址https://edu.aliyun.com/course/3112108/lesson/19263

机器学习概述(三)

十一、梯度下降算法的介绍

下面是三种常见的梯度下降算法,分别是批量梯度下降算法叫BGD,随机梯度下降算法是SGD,小批量梯度下降算法MBGD, gradient decent缩写第一个首字母就是GD,就是梯度下降。批量梯度下降的B就是batch批量的意思BGD。批量梯度下降算法是最基本的梯度下降算法,它是怎么样呢?它是用所有的样本,在当前点的梯度值,对变量参数进行更新的操作。这种方式所有的样本都是有贡献的,都是去参与调整参数,求出来的这个参数是使loose函数,它的值是最小的,但是当样本量极大的时候,它的计算量增大,模型收敛的速度慢。所以这种时候是不推荐用BGD这种方法的。随机梯度下降,这个S是随机的意思是stochastic随机。使用这种方法,在更新变量参数的时候,选取一个样本的梯度值来更新参数,这种方式因为只有一个样本数据参与梯度计算,所以它省略那些求和求平均的过程,所以计算复杂度就降低了,提升了计算的速度。但是它可能伴随一个问题是它的噪音会比批量梯度下降BGD要多,这样的话使用SGD随机梯度下降这种迭代的时候,可能并不是每次都是向着整体最优的方向,他的优点是训练速度快,但是它的缺点是准确度下降。然后这种方法还可能出现收敛到局部最优的这种方式,他不能因为选的单个样本不能代表全体样本的趋势。结合BJD和SGD,改进一下,可以用这个MBGD,MBGD这个M是mini,B是batch,就是小批量,小批量梯度下降算法。用这种方式在原始数据里面每次选N个样,来更新参数值。这个N一般是选择10,就是mini batch批量一般选的是十,它的优点是通过矩阵运算这种方式,每一次在batch上优化神经网络的参数,它不会比单个数据更慢。也就是说它的性能上是跟SGD是类似的,还有一个好处是他选择就用batch,可以减少收敛所需的迭代的次数。比如说有500万条样本,那batch size就是batch的大小,可能是100的时候,就要迭代5000次就可以了,就不用SDG那样迭代50万次。但是它也有一点缺点,就是batch size如果选择不当,可能会带来一些问题。总的来说是如果你的样本量比较小的时候,你就用批量梯度下降。如果你样本量太大的话,或者是用在线算法的话,就用随机的梯度下降。一般情况下就用MDGD,就用小批量梯度下降算法。

 

十二、机器学习常见的评估指标


接下来一起来学习一下机器学习的常见评估指标。通过机器学习方法得到一个模型之后,一般需要对模型进行评估。如果得到一个能够识别猫狗的模型,这个是在图像识别里面的例子。看到一个照片之后,机器能判断它是猫还是狗。得到这个模型之后,这个模型到底是好不好用,我们怎么去评估它?我们可能从下面三个方面来评估:首先猫狗是不是分类都是正确,有没有漏识别。如果是有分类错误的,那分类的错误有多少,需要从下面几个角度来进行评估。

图片469.png


机器学习的常见的评估指标,首先理解一下为什么要有评估指标,机器学习不管是用什么方法学习,学习之后得到模型,用模型去进行预测,能做什么事情。那学习的算法不同、学习的方式不同,那得到这个模型、结果是不一样的。那这个模型得到了之后,到底是怎么样的?它到底是好还是不好?要有一个指标对它进行评估,也就是说评估指标是对于模型效果的数值型的量化。一般来说指标越好,就说明这个模型做的越好。而对于分类任务来说,主要的评估指标有混淆矩阵、准确率、精确度和召回率,还有F1分数。对于回归类型的任务来说,经常用下面几种叫均方误差,平均绝对误差MAE,或者是均方根误差叫RMSE,回归任务经常是用这些指标来去评估。还有无监督任务,可能用兰德系数或者是互信息,或者是轮廓系数来进行评估,重点关注分类任务和回归任务的评估指标。

 

十三、介绍混淆矩阵的概念

分类任务常见的评估指标是混淆矩阵。混淆矩阵又称为误差矩阵,它的英文是confusion matrix,混淆矩阵表示精度评价的一种标准格式,它用N行N列的矩阵形式来表示。分类任务为什么要用混淆矩阵?混淆矩阵是什么?为什么要用这种方式去评价?其实很好理解,想一下分类,结果就是两种,分对了和分错了,要评价分类模型的时候,需要把这种分正确的和分错误的都要把它展示出来。用这种矩阵的方式去展示就非常的简单,非常的直观。看一下下面二分类的例子,二分类的混淆矩阵,像下面这个表所示:

实际值

预测值

真阳性 (TP)

预测值为真,实际值为真

假阳性 (FP)

预测值为真,实际值为假

假阴性 (FN)

预测值为假,实际值为真

真阴性 (TN)

预测值为假,实际值为假

理解一下里面的P和N,如果掷硬币,那么P表示positive是正面,N表示的是negative,就是反面。那么在预测值这里写好,这里是P,这里是N,那实际值第一列是P,第二列是N。把它当成一个分类问题的话,就是有两类,要么是P要么是N,这样就形成了一个2乘2的矩阵。往这个矩阵里面去填数字,去记录分类任务分类的情况。填数字的意义是怎么样的呢?我们来看一下:比如说第一个真阳性TP这里填的数字实际上是positive,那预测的也是positive的,就是实际值为真,预测值也为真的,称它为真阳性。真的话就写T,true, 所以真阳性就是TP,跟它对应的,在它的对角线上是真阴性。True negative,真阴性是预测值为假的,实际值也为假的。剩余的上面的假阳性,FP这里的数值是预测值为真,实际值为假的。然后左下角的假阴性,我们用FN来表示,它预测值为假,但是实际上是真,它不是真的阴性,它是假的阴性,是预测错的。来注意观察一下,在这个混淆矩阵里面,真阴性,真阳性,对角线里面的值都是预测正确的值。那除了对角线之外的都是预测错误的值。把整个矩阵里面所有的数字都加起来,就是所有的数据的值。这样就用对角线的值去除以整个矩阵,求的和得到的就是分类的准确性,这个混淆矩阵还能很清晰的告诉你,你分类错误的是哪里错了,是产生了假阳性,还是产生了假阴性。如果分类的任务是有N个分类的话,就可以用一个N乘N的N行N列的矩阵来表示分裂的结果的情况。从这个混淆矩阵里面很容易就能看得出来,分类的结果哪种分类分对了,分错了之后又分成了哪一种,可以这样说一个混淆矩阵基本上就说明了一切,这就是混淆矩阵的概念,需要大家理解这个混淆矩阵的行和列的意义,以及填到混淆矩阵里面数字所代表的含义。一起来看一下一个混淆矩阵的具体的事例:

图片470.png


像这里面看到实际的类别,用0001来表示,零就是一个类别,1也是一个类别,然后预测的类别00,但是第三个变成1了,然后010预测的类别是这样的,那实际类别和预测类别这样去看的话,没有那么直观,所以把它放在混淆矩阵里面去看。这个混淆矩阵的值是怎么出来的呢?其实里面每一个值,对应的是在这边矩阵里面反映了。比如说实际类别是零,预测类别是零,那么这个时候TN这个地方就给它增加1了,第二个也是,所以这个时候它就变成2,第三个是01,实际是零,然后预测的是1,所以这个时候是FP这里变成了1,然后以此类推,最后就变成了1113这样子的,看到这个习惯了之后,看到这个混淆矩阵之后,就知道有1是真阳性的,预测实际是匹配的。还有3,预测的是false是吧,实际上也是false,这个1和这个1右上和左下的这个1是预测错的,所以对角线上一共预测了六个值,有四个是正确的,这个就是混淆矩阵,它是怎么样产生的,看到之后怎么去理解混淆矩阵。

 

十四、分类任务的常见评估指标

下面介绍其他几种分类的常见的评估指标;

首先是准确率,准确率它是衡量分类正确的比例,简单说分类的时候有多少是被正确的进行分类了,准确率肯定是越高越好。准确率可以从混淆矩阵里面计算出来,这个是刚才的混淆矩阵,看一下左下角的图

图片471.png


它有预测值和实际值,要理解一下真阳性、假阳性、真阴性、假阴假。进行所有的分类的数据都在这里了,把所有的值加起来,就是总的数据。在分类的时候,分类正确的是对角线上的,也就是TP加上TN这部分。所以准确率是这样算的,看一下右边的公式accuracy等于下面TP,加上TN加上FP加上FN全部都加起来,然后上面是对角线,里面的是TP加上TN。比如在这个例子里面,所有的加起来是1113,加起来一共是有六个数据。被正确分类的是真阳性的1和真阴性的3,上面的分子就是4,1加3等于4,它的准确率是六分之四三分之二。第二个评估指标叫精确度,精确度又叫查准率,它指的是预测为正样本的样本中预测正确的比例。正样本就是这个P positive正样本。精确度是很容易跟准确率混在一起的,大家要注意区分,精确度不是准确率,它指的是正样本的预测正确的占比。看一下公式,精确度是precession,去预测的时候有多少被预测成正样本呢?也就是在预测的上面的这一行,真阳性跟假阳性的都是我们预测为正样本的,所以把它加起来,就是TP加上FP,TP加上FP就是2,然后上面的TP是1,也就是这个时候它的准确度是二分之一。第三个评估指标叫召回率,又叫查全率。其实顾名思义也能理解,分类是想把所有的这种真实的样本都找回来,将它们进行召回。检测的时候,有多少被找出来了,这个衡量的比率就是召回率。在混淆矩阵实际值里面,所有是真实样本在第一列里面,所以召回率它的分母是TP加上FN,TP加上FN它的分子是TP,所以这里面它的召回率也是二分之一。一般来说,这个精确度和召回率我们都想要,但是鱼和熊掌不可得兼,往往要去提高召回率的话,精确度就会下降。这样就会出现一些情况,比如一个分类任务,它的精确度可能很高,但是召回率很差。有的任务它可能召回率高,但是精确度差。这个时候怎么去衡量这个分类任务呢?可以用第四种F1分数,用它来权衡精确度和召回率。看一下它的公式

图片472.png


通过这种方式,在精确度和召回率之间做一个调和,也就是相当于去看一下谁的综合成绩会更好。以上就是分类任务的常见评估指标。

 

十五、回归任务的常见评估指标


刚才说的是分类任务,现在看一下回归任务里面常见的一些评估指标,也就是得到的回归模型怎么样?可以有下面几种评估指标,分别是均方误差MSE,平均绝对误差MAE,均方根误差RMSE。这个名字其实都是它的英文的缩写,均方误差又叫L2范数损失,它是算真实值和预测值的差值的平方和。MAE又叫L1范数损失,是计算真实值和预测值的差的绝对值的均值差的绝对值的均值,均方根是预测值和真实值的,叫样本标准差。举一个例子看一下

图片473.png


可能这种情况,实际值是这样的,1.3到2.2。得到模型之后,进行预测,得到的值对应的是1.1和2.3是有差别的。实际值和预测值之间是有差距的,那这个差距怎么去衡量呢?这三种均方差和平均绝对值误差和均方根误差,他们三个算出来的值是不一样的。那MSE均方误差,是预测值跟实际值它们差的平方和。MAE是没有差的,它MAE就用的就是绝对值,对比一下区别,这个是差的平方,然后是它的绝对值,那RMSE均方根误差,它是有求一个平方根,再去算差的和算出来的,在实际的应用过程中,会发现三种都可以。但是在实际使用中你会发现,对于有些模型进行比较的时候,可能有的方式差别会更加明显一点。跟这个算法一样,每种评估指标有它的优势,也有它的局限性。大家在实际的使用中可以就都算出来,比较一下。

 

十六、回顾内容


通过本节的学习,首先学到了人工智能、机器学习和深度学习三者之间的关系,三者是目标是统一的,都是要给机器去赋予人的智能。

机器学习是实现人工智能的一种途径,深度学习也是被认为是机器学习中的一种。

机器学习指的是利用已有的数据或者是经验,开发可以用来对新数据进行预测的模型开发模型。

基于学习方式去划分机器学习可以划分为有监督的学习,无监督的学习和强化学习;基于学习策略的划分,机器学习可以划分为传统的机器学习和深度学习。

分类和回归的定义和区别,他们主要区别:分类它预测变量是离散的,回归预测的变量是连续的。

机器学习里面有重要的两个函数的概念:一个是损失函数,损失函数是用来估量模型的预测值和实际的真实值的不一致的程度,损失函数得到的这个值越小越好。然后是优化函数,因为我们机器学习的过程就是不断的去调节参数的过程,优化函数就是帮助我们去调节参数,让这个损失函数的值变小。

机器学习完成后要进行评估,评估指标是建立在不同的学习任务上面,分类回归还无监督学习,这种不同的任务得到的这个指标是不一样的,分类的指标主要有准确率、精准度和精确度、召回率、F1分数,都是通过混淆矩阵得来的。回归的评估指标,主要有均方差、平均绝对误差、均方根误差。

相关文章
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】人工智能概述
【机器学习】人工智能概述
119 0
|
机器学习/深度学习 人工智能 算法
【机器学习-黑马程序员】人工智能、机器学习概述
机器学习和人工智能、深度学习的关系 机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来的 机器学习的应用场景非常多,主要有下图三种领域:
139 0
|
3月前
|
机器学习/深度学习 算法 API
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
|
3月前
|
机器学习/深度学习 人工智能 算法
机器学习概述
机器学习概述
35 0
|
5月前
|
机器学习/深度学习 算法 TensorFlow
【人工智能】TensorFlow和机器学习概述
TensorFlow的性能优化将是持续的工作重点。这包括更高效的GPU和TPU支持、更快速的模型训练与推理、以及优化的内存使用。同时,随着硬件的发展,TensorFlow将不断优化其代码库以充分利用新型硬件的能力。
41 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
572 0
|
8月前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习概述(二)
【1月更文挑战第26天】【人工智能】机器学习概述(二)
|
8月前
|
机器学习/深度学习 人工智能 算法
【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
|
8月前
|
机器学习/深度学习 数据采集 人工智能
数据分析概述2(详细介绍机器学习
数据分析概述2(详细介绍机器学习
76 0
|
机器学习/深度学习 人工智能 边缘计算
机器学习专栏——(一)人工智能概述4
人工智能和机器人技术正在以前所未有的速度发展,对社会和经济产生深刻影响。本文将探讨人工智能和机器人领域的未来趋势和发展方向,重点关注以下几个方面:通用人工智能、人机协作、强化学习、迁移学习、边缘计算以及道德和法律议题。
134 0