机器学习的基本概念-1| 学习笔记-阿里云开发者社区

机器学习的基本概念-1| 学习笔记

2022-11-12 118

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习机器学习的基本概念-1。

开发者学堂课程【机器学习算法：机器学习的基本概念-1】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/535/detail/7166

机器学习的基本概念-1

内容介绍

一、机器学习的方法流程

二、输出空间与输入空间

三、特征空间

一、机器学习的方法流程

1、以监督学习方法为例：实现提供以知结果样本，按照样本学习，建立模型，也可以理解为照例题写新题。

我们拿到的数据是有结论的，根据有结果的数据构建模型，再将模型运用到新的模型上。

模型：在脑子里已经形成结论。可能是公式，图谱。

2、监督学习的流程

（1）输入数据（有结果的样本数据。对特征加工整理）

（2）特征工程（基于数据建立特征。也称为特征。在输入数据的基础上做了加工，拓展，合并，形成新的特征。特征可能和输入的数据一致。也可以改变）

（3）模型训练（既定的公式。建模的过程是反复的过程。）

（4）模型部署（建模成功之后你进行模型的部署，形成产品的公式。）

（5）模型应用

图片1.png

实际上许多业务都是动态变化的，数据也在动态变化。有可能模型的数据周期是有限的。需要定期去更新模型。就是最后一条线。在使用过程中，定时去做模型的升级管理。更新以及重新建模。

二、输出空间与输入空间

1、输入空间(Input Space）：将输入的所有可能取值的集合称作输入空间。

2、输出空间(Output Space）：将输出的所有可能取值的集合称作输出空间。

例如：

采集了一些父子的身，对这些数据进行建模，然后使用模型根据输入的父亲的身高去预测其子身高的取值。

图片2.png

父亲的身高就是输入的特征，父亲身高所有的取值就叫做输入空间。（是一个连续的一个值）儿子的身高就是输出值，所有的取值就是输出空间。

搜集了泰坦尼克号上乘客的相关信息，对这些数据进行建模，使用模型去预测某个乘客是否能够生还。

图片3.png

收集了乘客的信息，以及存活状况。通过此建立生还的模型。不具备普适性。

Survived 存活的状况，这个是最后的实际输出空间，实际空间只有两个指标，一个是生还，一个是遇难。除了这个以外都是输入空间。输入空间不是一维的，是有许多维度构成的。

（1）输入空间和输出空间可以是有限元素的集合，也可以是整个欧氏空间

（2）输入空间和输出空间可以是连续值集合（身高），也可以是离散值集合（分类）

（3）输入空间和输出空间可以是同一个空间，也可以是不同空间

（4）通常输出空间会比输入空间小

三、特征空间

1、特征（Feature）：即属性。每个输入实例（每一条输入的记录）的各个组成部分（属性）称作原始特征，基于原始特征还可以扩展出更多的衍生特征。

2、特征向量( Feature Vector)：由多个特征组成的集合，称作特征向量。

3、特征空间 ( Feature Space )：将特征向量存在的空间称作特征空间。

例如：

图片4.png

特征：父亲身高 165

特征向量：一维，(165)

图片5.png

除了 survived 以外其他所有的输入实例的属性。

特征：Passengerld, Pclass,Name,Sex,Age, SibSp,Parch, Ticket,Fare, Cabin, Embarked

特征向量：十一维，(1,3,'Braund，Mr. Owen Harris", "male",22,1,0,"A/5 21171",7.25,"- "S")

特征空间：sex和age的所有值。

Fare 是一个连续的值，是原始特征。在做分析时要定义到 C-level 上。在建模时可能不会使用原始的价钱，使用做过离散化的值。

特征：Sex="male"，Age=22，C level=“L”

特征向量：三维，('male",22," L” ), ( “female",38,” H”）

（1）特征空间中每一维都对应了一个特征（属性）

（2）特征空间可以和输入空间相同，也可以不同

（3）需将将实例从输入空间映射到特征空间，通过固定的变化规则从一个空间映射到另一个空间。

（4）模型实际上是定义于特征空间之上的