ML之SL:监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略

简介: ML之SL:监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略

监督学习(Supervised Learning)的简介


      监督学习,是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。

      监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。


image.png


      监督学习中的数据集是有标签的,就是说对于给出的样本我们是知道答案的。如果机器学习的目标是通过建模样本的特征x和标签y之间的关系:f (x,θ)或p(y|x, θ),并且训练集中每个样本都有标签,那么这类机器学习称为监督学习。



1、监督学习问题的两大类—分类问题和回归问题


      根据标签类型的不同,又可以将其分为分类问题和回归问题两类。前者是预测某一样东西所属的类别(离散的),比如给定一个人的身高、年龄、体重等信息,然后判断性别、是否健康等;后者则是预测某一样本所对应的实数输出(连续的),比如预测某一地区人的平均身高。我们大部分学到的模型都是属于监督学习,包括线性分类器、支持向量机等。



2、监督学习常见的算法


      常见的监督学习算法有:k-近邻算法(k-Nearest Neighbors,kNN)、决策树(Decision Trees)、朴素贝叶斯(Naive Bayesian)等。



3、监督学习过程

image.png




1、Model selection during prototyping phase


image.png




监督学习(Supervised Learning)的应用


1、监督学习、半监督学习和非监督学习之间的区别



image.png

       可以看到,图2-7(a)中,红色三角形数据和蓝色圆点数据为标注数据;图2-7(b)中,绿色的小圆点为非标注数据。图2-7(c)显示监督学习将有标签的数据进行分类;而半监督学习如图2-7(d)中部分是有标签的,部分是没有标签的,一般而言,半监督学习侧重于在有监督的分类算法中加入无标记样本来实现半监督分类。




相关文章
|
机器学习/深度学习 算法 数据挖掘
【机器学习】算法术语、决策函数、概率模型、神经网络的详细讲解(图文解释)
【机器学习】算法术语、决策函数、概率模型、神经网络的详细讲解(图文解释)
1124 1
lda模型和bert模型的文本主题情感分类实战
lda模型和bert模型的文本主题情感分类实战
556 0
|
机器学习/深度学习 人工智能 自然语言处理
自监督学习:引领机器学习的新革命
自监督学习的思想可以追溯到几年前,最早是在图像处理领域被提出。随着深度学习的快速发展,研究者们逐渐认识到未标注数据的巨大潜力。尤其是在大规模数据集的爆炸式增长下,获取标注数据的成本越来越高,而利用自监督学习的方法来减少对标注数据的依赖变得越来越重要。
|
11月前
|
机器学习/深度学习 传感器 搜索推荐
《洞察因果本质:解锁智能体大模型精准预测的底层逻辑》
因果表征学习作为新兴领域,致力于挖掘数据背后的因果结构,突破传统基于相关性的表征学习局限,为智能体大模型提供更精准的预测能力。通过揭示数据生成机制、打破相关性局限和整合多源信息,它在工业故障预测、农业产量优化、电商推荐等领域展现巨大潜力。尽管面临数据挖掘与框架融合等挑战,但其未来前景广阔,有望推动医疗、金融、智慧城市等多领域实现更深层次的理解与决策优化。
323 11
|
机器学习/深度学习 编解码 人工智能
一篇文章搞懂CNN(卷积神经网络)及其所含概念
一篇文章搞懂CNN(卷积神经网络)及其所含概念
888 0
一篇文章搞懂CNN(卷积神经网络)及其所含概念
|
存储 JSON API
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
Python| 如何使用 DALL·E 和 OpenAI API 生成图像(1)
|
机器学习/深度学习 自然语言处理 算法
机器学习核心:监督学习与无监督学习
本文深入解析了机器学习中的监督学习与无监督学习,涵盖理论基础、应用场景及典型算法实现,如线性回归、决策树、K均值聚类和主成分分析,并通过代码示例加深理解。适合初学者和进阶者阅读。
1025 5
|
机器学习/深度学习 算法
没有免费午餐定理
没有免费午餐定理
582 2
|
机器学习/深度学习 人工智能 算法
这篇科普让你Get所有大模型的基础核心知识点
本文介绍了AI大模型的概念和发展历程。AI大模型是指具有1亿以上参数的机器学习模型,通过在大规模数据集上进行预训练,可以直接支撑各类应用。大模型的发展经历了从萌芽期到AI1.0时期,再到AI2.0时期的飞跃,目前最新发布的大模型参数已经达到了千亿甚至万亿级别。国内外的公司都在积极研发和应用大模型,如OpenAI、Google、Facebook、Microsoft等。国内也有百度、阿里巴巴、万维、商汤科技等公司发布了自己的大模型产品。大模型的建造离不开算力资源、算法人才、数据积累等核心要素。此外,文章还列举了一些与大模型相关的专业名词,如算法、模型参数、训练数据、Token等。
|
算法 数据挖掘 数据库
K-Means、层次聚类算法讲解及对iris数据集聚类实战(附源码)
K-Means、层次聚类算法讲解及对iris数据集聚类实战(附源码)
1086 0