【ML入门系列】(二)分类与回归

简介: 前言 在机器学习中,“分类”和“回归”这两个词经常听说,但很多时候我们却混为一谈。本文主要从应用场景、训练算法等几个方面来叙述两者的区别。  本质区别 分类和回归的区别在于输出变量的类型。分类的输出是离散的,回归的输出是连续的。

前言

在机器学习中,“分类”和“回归”这两个词经常听说,但很多时候我们却混为一谈。本文主要从应用场景、训练算法等几个方面来叙述两者的区别。

 本质区别

分类和回归的区别在于输出变量的类型。分类的输出是离散的,回归的输出是连续的。

定量输出称为回归,或者说是连续变量预测; 定性输出称为分类,或者说是离散变量预测。

若我们欲预测的是离散值,例如"好瓜""坏瓜",此类学习任务称为 "分类"。
若欲预测的是连续值,例如西瓜的成熟度0.95 ,0.37,此类学习任务称为"回归"。

                                                                                                              《机器学习》周志华著

分类就是想办法让一堆数据站队,找出最符合其自身特征的群体。

例:有群体y=x和y=-x,数据集(1,1) (-2,2) (3,-3) (-4,-4)... (n,n),(1,1),(-4,-4)就符合群体y=x,(-2,2) (3,-3)就符合群体y=-x。

回归就是数学意义上的找出一个函数,让某些数据尽量符合这个函数的特征。例如线性回归(Linear Regression,LR)。

例:(1,1) (2,2) (3,3) ... (n,n)这些数据回归后的结果就是函数 y = x。

 举例说明:

  • 预测明天的气温是多少度,这是一个回归任务;
  • 预测明天是阴、晴还是雨,就是一个分类任务。

应用场景

分类问题

分类问题是用于将事物打上一个标签,通常结果为离散值。例如判断一幅图片上的动物是一只猫还是一只狗,分类通常是建立在回归之上,分类的最后一层通常要使用softmax函数进行判断其所属类别。

分类并没有逼近的概念,最终正确结果只有一个,错误的就是错误的,不会有相近的概念。最常见的分类方法是逻辑回归,或者叫逻辑分类。

回归问题

回归问题通常是用来预测一个值,如预测房价、未来的天气情况等等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。

一个比较常见的回归算法是线性回归算法(LR)。另外,回归分析用在神经网络上,其最上层是不需要加上softmax函数的,而是直接对前一层累加即可。回归是对真实值的一种逼近预测。

总结

解决的问题类型

分类问题是从不同类型的数据中学习到这些数据间的边界,比如通过鱼的体长、重量、鱼鳞色泽等维度来分类鲶鱼和鲤鱼,这是一个定性问题

回归问题则是从同一类型的数据中学习到这种数据中不同维度间的规律,去拟合真实规律,比如通过数据学习到面积、房间数、房价几个维度的关系,用于根据面积和房间数预测房价,这是一个定量问题

 

目录
相关文章
|
开发工具 数据安全/隐私保护 UED
Uniapp 微信登录流程解析
Uniapp 微信登录流程解析
511 0
|
编解码 安全 网络协议
实测:游戏情景中,远控软件实力如何?一篇告诉你ToDesk的强大之处
实测:游戏情景中,远控软件实力如何?一篇告诉你ToDesk的强大之处
实测:游戏情景中,远控软件实力如何?一篇告诉你ToDesk的强大之处
|
前端开发 API 对象存储
FileSaver.js源码学习,纯前端实现文件下载
FileSaver.js源码学习,纯前端实现文件下载
1209 0
|
Java BI Scala
6款实用开源报表工具
大数据时代,从海量数据中挖掘出有用的数据,并以较人性化、直观的方式展示这些数据,变得尤为重要。今天小编为大家介绍6款实用的开源报表工具,你可以使用这些工具做出高效,且符合企业需求的报表。
33019 0
|
8月前
|
JSON 前端开发 应用服务中间件
跨域请求(CORS)如何解决?
CORS 全称为(Cross-Origin Resource Sharing:跨站资源共享),跨域请求是由于浏览器的同源策略(Same-Origin Policy)引起的,那么 CORS 的产生和浏览器的同源策略有关系,我们先了解什么是同源策略。
|
机器学习/深度学习 人工智能 算法
【机器学习】平均绝对误差 (MAE) 与均方误差 (MSE) 有什么区别?
【5月更文挑战第17天】【机器学习】平均绝对误差 (MAE) 与均方误差 (MSE) 有什么区别?
|
机器学习/深度学习 数据采集 人工智能
使用机器学习进行用户行为预测的技术探索
【8月更文挑战第9天】使用机器学习进行用户行为预测是一项复杂而充满挑战的任务。它要求开发者具备扎实的机器学习基础、丰富的数据处理经验和深入的业务理解。通过不断的数据收集、处理、特征工程、模型训练和优化,可以构建出高效、准确的用户行为预测模型,为企业决策提供有力支持。未来,随着技术的不断发展和数据的不断积累,用户行为预测领域将迎来更加广阔的发展前景。
|
安全 数据安全/隐私保护
WiFi工作原理及WiFi接入过程
【9月更文挑战第17天】WiFi(Wireless Fidelity)是一种基于IEEE 802.11标准的无线局域网技术,使用2.4GHz和5GHz频段进行数据传输,并通过正交频分复用(OFDM)技术提高传输效率。WiFi网络通常由接入点和客户端组成,采用IEEE 802.11系列协议实现通信。接入WiFi网络需经历扫描、选择网络、身份验证和关联等步骤,最终实现数据传输。
1602 4
|
Go API 开发者
Golang Websocket框架:实时通信的新选择
Golang Websocket框架:实时通信的新选择
|
消息中间件 中间件 Java
中间件选择合适的中间件
【7月更文挑战第8天】
581 2