机器学习概述(一)

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: 机器学习概述(一)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):机器学习概述(一)】

课程地址https://edu.aliyun.com/course/3112108/lesson/19263


机器学习概述(一)

 

内容介绍

一、机器学习基础的概括和深度学习

二、机器学习得定义和方向

三、机器学习基于学习方式的划分

四、有监督学习的过程和强化学习

五、无监督学习的过程和强化学习

六、机器学习基于策略方式的划分

七、分类和回归得定义和区别

八、机器学习常见函数

九、损失函数

十、优化函数

十一、梯度下降算法的介绍

十二、机器学习常见的评估指标

十三、介绍混淆矩阵的概念

十四、分类任务的常见评估指标

十五、回归任务的常见评估指标

十六、回顾内容

 

课程目标

学习完本课程后,你将能够:

• 理解人工智能、机器学习与深度学习三者的关联

• 根据数据特点和学习目标选择不同的机器学习类别(如有监督学习、无监督学习、强化学习)

• 准确区分有监督学习中的分类任务和回归任务

• 根据损失函散计算损失函数值

• 计算出分类任务和回归任中务常模型评估指标的值

• 根据模型的表现特点区分出模型的过拟合和欠拟合

• 掌握将二分类器变为多分类器的技术解决手段

• 理解传统机器学习经典算法(如,线性回归、逻辑回归、朴素贝叶斯、K近邻、支持向量机、决策树、集成算法、聚类算法)的特点以及主要应用场景,并可根据实际场景在机器学习

PAI平台上应用相应的算法

 

一、人工智能、机器学习和深度学习的关系


人工智能机器学习和深度学习这三个词经常会出现,而且经常被混用。比如说有的人说我是研究人工智能的,然后我们用机器学习的方式来做什么事情。

人工智能、机器学习和深度学习是什么关系呢?

首先这三个词其实目标都是一致的。在目标上三个词是统一的,就是给机器赋予人的智能,让机器能够像人一样的去思考问题,做出决策。人工智能一听起来,就是让人工去制造智能,让机器有人的智能,机器学习就机器能够像人一样去学习。深度学习也是一样的,但深度学习是用来另外的一种方式。目标上面是一致的,我们看下图

图片456.png


最外面的是人工智能,人工智能是一个更大的概念。

机器学习是包含在人工智能概念。

第一点机器学习是实现人工智能的一种途径。要实现人工智能可以用机器学习的方式去实现。是让机器用算法去解析数据。从那个数据里面学习出来数据的特征并进行归纳和判断。机器学习是这样的一个过程,它是实现人工智能的一种途径。

第二点是深度学习,深度学习是机器学习的一类重要方法,采用多层非线性的函数,就是神经网络来学习数据的特征并进行判断,属于机器学习、解决图像、语音、文本等领域的一个重要分支。我们把这部分总结一下,机器学习是人工智能实现的一个重要的途径。

深度学习是机器学习里面的一种重要的方法。

在课程体系里面,深度学习单独的有一章。是因为随着人工智能技术的发展,我们发现深度学习在解决问题的时候,在很多场景是非常有效的。所以深度学习被发展的越来越快,也被着重的画出来。

 

二、机器学习得定义和方向

下面一起来学习一下机器学习的定义和方向。首先来看一下机器学习的定义。机器学习是通过技术的手段,利用已有的数据或者是经验来开发,可以用来对新的数据进行预测的模型。这是机器学习的正式的定义。我们来解释一下这个定义,通过这个定义,我们要明白,机器学习首先它的材料是什么?它的材料是数据。用数据来得到什么?得到模型,机器学习是要研究怎么样通过数据得到模型。这个得到的模型有什么用?主要的用途是对新数据进行预测。了解了机器学习的定义,其实也就知道机器学习主要做什么,主要是去研究能产生模型的算法。机器学习的主要方向,可以像下面这种方式去划分

图片457.png

一种是基于学习的方式的划分,一种是基于学习的策略的划分,基于学习方式的划分,它去根据你这个学习,输入数据是否要进行标注来划分。这个方向是着眼在你学习的数据特色上面。另外一个,是可以根据他学习的策略进行划分。你的学习策略到底是用经典的数学原理,这是一个大的方向。另外就是策略就直接去模拟人脑,这是一个方向。

 

三、机器学习基于学习方式的划分

首先基于学习方式的划分,机器学习可以划分为有监督的学习,无监督的学习和强化学习三个大的方向。

图片458.png

其实与其说是根据学习方式的划分,不如说是根据有的数据的这个形

态的来进行划分。有监督的学习主要是数据有了标注,学习是有依据的,无监督的就只有数据,没有监督,就从数据里面学习。强化学习就应对更特殊一点的,这三种学习方式,我们在稍后会更详细的来说明。

 

四、有监督学习的过程和强化学习

首先来一起看一下有监督的学习,有监督的学习比较有特点,它的输入数据叫训练数据。输入来进行训练的数据,每一组都有一个明确的标识。这个输入数据有明确的标识,也说明为什么把这种学习称为有监督的学习,学习的过程是是将预测结果和训练数据的实际结果进行比较。为什么叫有监督的?因为提供的这个训练数据已经有了标识。那标识是我们认为它是正确的,训练出模型来之后,得到的是我们的预测结果。这个预测结果跟训练数据里面,原来就标识的那个结果,有进行比较,可能会有不同,有差别。这个差别我们就可以用这个来调整预测的模型。这个过程中,你可以就认为我们是用数据来监督这个模型,然后再调整这个模型,直到让这个预测的结果达到一个预期的准确率,才停止学习。这个也是有监督学习这个名字的由来。我们一起来看一下右边这张图

图片459.png

首先有监督学习的英文叫supervised learning,这个过程是怎么样的呢?就是有data,有数据。数据经过训练,经过training,得到模型。数据会根据已经预先知道的class levels,分类标签来进行划分分割,进行divide。像这里面的数据就分成了on positive dataset 和negative dataset,是正的数据集和负的数据集。其实这里主要标明的就是数据是有已经标注的。然后经过training,经过训练之后得到模型,训练之后,会得到这个likelier hood model,就是自然模型,就可以用这个模型去做预测。

 

五、无监督学习的过程和强化学习


无监督学习,它的输入的数据跟有监督的不一样。它输入的数据都是没有明确的标识,因为它的特征,所以它的学习过程不存在这个目标变量,只能是你研究数据本身,它叫基于数据本身,去识别变量之间的内在的模式和特征。它的应用场景主要就是关联分析和聚类分析这种场景。我们看下右边这个图比较一下有监督学习和无监督学习

图片460.png

有监督的学习叫supervised learning,无监督学习叫unsurpervised learning,里面的数据,有圆的,有红色的叉,蓝色的圆。这是数据已经做了标注,叫明显的标识,有监督的学习在这种情况下,可能他的目标是去找出来这个数据之间的这个boundary,他们之间的边界。


在无监督学习的情况下,数据就都是蓝色的圈,没有进行区分,没有明确的标识,那他的任务是什么呢?

这里面任务叫clusters ,cluster 是聚类的意思,是蓝色圈圈的数据,那你的数据之间没有标识,只能自己去发现数据之间可能有什么样的模式,有什么样的特征,那聚类是找他们数据之间的聚合的特征,这个图标出来的是已经进行聚类的,这个数据是这样分布的,可能通过某些算法去发现,数据可能分了三个簇,三个cluster,三有一些数据是在红色区域,有一些是在这个绿色,有一些是在蓝色区域,找到这个特征,这个过程就是无监督学习可以解决的。它跟前面主要的区别还是有监督学习的主要的区别还是在数据上面,它是没有明确的标识的。


第三种是强化学习。强化学习是一种机器学习的方式,什么样的方式呢?它是用试错的这种方式进行学习。

图片461.png

他试错的过程是通过跟环境进行交互,获得奖赏指导的行为。也就是他一边去试错,一边在获取数据,它的目标是使智能体获得最大的奖赏,或者是实现特定的目标。这种强化学习的方式,它的输入数据也不是要你先预定给他这个数据,是启动了之后,接受反环境对他的反馈来获得学习信息,可以认为他是在行动的过程中去得到数据。

它这样的输入数据输出的是什么呢?

它根据环境反馈学习,做出来它模型参数的调整,主要它的应用领域有机器人控制,还有计算机视觉,还有自然语言处理。这种强化学习可能不太好理解,因为强化学习是没有人指导,是通过试错来提升这个任务的性能的过程。这个试错的意思是还有一个衡量的标准。

比如,用棋类游戏来举例,我们不知道这个棋手他下一步棋下的是对是错,也不知道哪步棋是制胜的关键,但是能知道最后下棋的结果是输了还是赢了。如果这个算法这样走,最后的结果是胜利了,那么这个算法就记住这样走就对了。如果是按照这样走的,走错了走输了,所以以后就要学习以后不能再这样走了。所以强化学习就是用这种试错的方式来通过跟环境的交互来获得新的数据。他不要求你先给他预置任何数据,通过环境的动作的奖励和反馈和学习信息,最后得到反馈不符合要求就来调整模型的参数。

举例,还拿下棋来说,可能没有教你一些套路,就去下棋,就不断的下棋,不断的去积累经验。那在下的过程中,自己就学习,数据就是交互的过程中产生的这个数据。学习的过程是把自己当成一个智能体,得到的也是一个经过训练的智能体。

相关文章
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】人工智能概述
【机器学习】人工智能概述
114 0
|
机器学习/深度学习 人工智能 算法
【机器学习-黑马程序员】人工智能、机器学习概述
机器学习和人工智能、深度学习的关系 机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来的 机器学习的应用场景非常多,主要有下图三种领域:
137 0
|
3月前
|
机器学习/深度学习 算法 API
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
机器学习入门(五):KNN概述 | K 近邻算法 API,K值选择问题
|
3月前
|
机器学习/深度学习 人工智能 算法
机器学习概述
机器学习概述
33 0
|
5月前
|
机器学习/深度学习 算法 TensorFlow
【人工智能】TensorFlow和机器学习概述
TensorFlow的性能优化将是持续的工作重点。这包括更高效的GPU和TPU支持、更快速的模型训练与推理、以及优化的内存使用。同时,随着硬件的发展,TensorFlow将不断优化其代码库以充分利用新型硬件的能力。
40 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
506 0
|
8月前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习概述(二)
【1月更文挑战第26天】【人工智能】机器学习概述(二)
|
8月前
|
机器学习/深度学习 人工智能 算法
【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
|
8月前
|
机器学习/深度学习 数据采集 人工智能
数据分析概述2(详细介绍机器学习
数据分析概述2(详细介绍机器学习
75 0
|
机器学习/深度学习 人工智能 边缘计算
机器学习专栏——(一)人工智能概述4
人工智能和机器人技术正在以前所未有的速度发展,对社会和经济产生深刻影响。本文将探讨人工智能和机器人领域的未来趋势和发展方向,重点关注以下几个方面:通用人工智能、人机协作、强化学习、迁移学习、边缘计算以及道德和法律议题。
132 0