【ML入门系列】(二)分类与回归

简介: 前言 在机器学习中,“分类”和“回归”这两个词经常听说,但很多时候我们却混为一谈。本文主要从应用场景、训练算法等几个方面来叙述两者的区别。  本质区别 分类和回归的区别在于输出变量的类型。分类的输出是离散的,回归的输出是连续的。

前言

在机器学习中,“分类”和“回归”这两个词经常听说,但很多时候我们却混为一谈。本文主要从应用场景、训练算法等几个方面来叙述两者的区别。

 本质区别

分类和回归的区别在于输出变量的类型。分类的输出是离散的,回归的输出是连续的。

定量输出称为回归,或者说是连续变量预测; 定性输出称为分类,或者说是离散变量预测。

若我们欲预测的是离散值,例如"好瓜""坏瓜",此类学习任务称为 "分类"。
若欲预测的是连续值,例如西瓜的成熟度0.95 ,0.37,此类学习任务称为"回归"。

                                                                                                              《机器学习》周志华著

分类就是想办法让一堆数据站队,找出最符合其自身特征的群体。

例:有群体y=x和y=-x,数据集(1,1) (-2,2) (3,-3) (-4,-4)... (n,n),(1,1),(-4,-4)就符合群体y=x,(-2,2) (3,-3)就符合群体y=-x。

回归就是数学意义上的找出一个函数,让某些数据尽量符合这个函数的特征。例如线性回归(Linear Regression,LR)。

例:(1,1) (2,2) (3,3) ... (n,n)这些数据回归后的结果就是函数 y = x。

 举例说明:

  • 预测明天的气温是多少度,这是一个回归任务;
  • 预测明天是阴、晴还是雨,就是一个分类任务。

应用场景

分类问题

分类问题是用于将事物打上一个标签,通常结果为离散值。例如判断一幅图片上的动物是一只猫还是一只狗,分类通常是建立在回归之上,分类的最后一层通常要使用softmax函数进行判断其所属类别。

分类并没有逼近的概念,最终正确结果只有一个,错误的就是错误的,不会有相近的概念。最常见的分类方法是逻辑回归,或者叫逻辑分类。

回归问题

回归问题通常是用来预测一个值,如预测房价、未来的天气情况等等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。

一个比较常见的回归算法是线性回归算法(LR)。另外,回归分析用在神经网络上,其最上层是不需要加上softmax函数的,而是直接对前一层累加即可。回归是对真实值的一种逼近预测。

总结

解决的问题类型

分类问题是从不同类型的数据中学习到这些数据间的边界,比如通过鱼的体长、重量、鱼鳞色泽等维度来分类鲶鱼和鲤鱼,这是一个定性问题

回归问题则是从同一类型的数据中学习到这种数据中不同维度间的规律,去拟合真实规律,比如通过数据学习到面积、房间数、房价几个维度的关系,用于根据面积和房间数预测房价,这是一个定量问题

 

目录
相关文章
|
4月前
|
机器学习/深度学习 算法 Python
【Python机器学习】分类算法任务、分类模型评价指标详解(图文解释)
【Python机器学习】分类算法任务、分类模型评价指标详解(图文解释)
79 0
|
17天前
|
机器学习/深度学习 数据采集 算法
机器学习实战第1天:鸢尾花分类任务
机器学习实战第1天:鸢尾花分类任务
41 0
|
6月前
|
机器学习/深度学习 Python
【Python机器学习】实验13 基于神经网络的回归-分类实验
【Python机器学习】实验13 基于神经网络的回归-分类实验
42 0
|
11月前
|
机器学习/深度学习 数据采集 算法
机器学习之PyTorch和Scikit-Learn第2章 为分类训练简单机器学习算法Part 2
前一节中,我们学习了Rosenblatt感知机规则的原理,下面使用Python进行实现并使用第1章 赋予计算机学习数据的能力中介绍的鸢尾花数据集进行训练。
197 0
机器学习之PyTorch和Scikit-Learn第2章 为分类训练简单机器学习算法Part 2
|
11月前
|
机器学习/深度学习 人工智能 算法
机器学习之PyTorch和Scikit-Learn第2章 为分类训练简单机器学习算法Part 1
本章中我们会使用所讲到的机器学习中的第一类算法中两种算法来进行分类:感知机(perceptron)和自适应线性神经元(adaptive linear neuron)。我们先使用Python逐步实现感知机,然后对鸢尾花数据集训练来分出不同花的品种。这有助于我们理解用于分类的机器学习算法概念以及如何用Python进行有效的实现。
134 0
机器学习之PyTorch和Scikit-Learn第2章 为分类训练简单机器学习算法Part 1
|
11月前
|
机器学习/深度学习 算法 数据挖掘
Lesson 3. 线性回归的手动实现(3.3 线性回归手动实现与模型局限 & 3.4 机器学习模型结果可信度理论与交叉验证基础)
Lesson 3. 线性回归的手动实现(3.3 线性回归手动实现与模型局限 & 3.4 机器学习模型结果可信度理论与交叉验证基础)
|
机器学习/深度学习 算法 Python
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
438 0
机器学习 基于Adult数据集的逻辑回归与朴素贝叶斯分类
|
机器学习/深度学习 算法
ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测的模板流程
ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测的模板流程
ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测的模板流程
|
机器学习/深度学习 人工智能 算法
图解机器学习 | 随机森林分类模型详解
随机森林是一种由决策树构成的(并行)集成算法。本文讲解随机森林算法涉及的模型集成、Bagging、算法特点及优缺点等重要知识点,最后介绍关键参数和参数调优。
779 1
图解机器学习 | 随机森林分类模型详解
|
机器学习/深度学习 数据采集 算法
轻松玩转 Scikit-Learn 系列 —— 线性回归及 ML 相关评价标准
线性回归可能是机器学习中最简单、最基础的算法了。但一定不要因为它简单就轻视它的存在,因为它也是很多更高级机器学习算法的基础,比如多项式回归、岭回归、 LASSO 回归等。线性回归的核心归结为求解正规方程(由样本特征x所得预测值y'和实际值y差的平方和,对x求偏导并使其为0所得的方程组),也就是利用最小二乘法求解方程系数。当x为一个n维向量时,方程的物理意义也被扩展为求解一个n维超平面前的系数。在介绍线性回归之前,让我们先了解下衡量线性回归预测结果好坏的指标。
144 0
轻松玩转 Scikit-Learn 系列 —— 线性回归及 ML 相关评价标准