机器学习的魔法(二)超越预测的界限-揭秘机器学习的黑科技-探索监督学习中的回归和分类问题

简介: 机器学习的魔法(二)超越预测的界限-揭秘机器学习的黑科技-探索监督学习中的回归和分类问题

前面我们提到了监督学习的概念,现在我们来回顾一下,什么是监督学习。

监督学习指的是:我们给学习算法一个数据集,这个数据集由正确答案组合而成,然后机器运用学习算法,算出更多的正确答案。


1、监督学习之回归问题

我们接着,上节提到的房价预测案例,进一步说明。



如上图,横轴表示房子的面积,单位是平方英尺,纵轴表示房价,单位是千美元。


基于以上数据,假如 你有个朋友,她有750平方英尺的房子,能卖多少钱。

我们应用学习算法:

  • 可以在这组数据中拟合一条直线,我们可以根据这条直线推测出 ,这套房子可以卖150K美元。
  • 可以这组数据中使用二次方程拟和曲线,可以从曲线这个点,推测出这套房子可以卖200k美元。

以上案例的房价实际上是一系列的离散值,我们通常把它看成实数,看成标量,所以又把它看成一个连续的数值。

我们尝试推测一系列连续值的结果(房价),这叫回归问题


2、监督学习之分类问题

我们再举另外一个监督学习的例子。

假设:你想通过查看病历来推测乳腺癌良性与否。

假如有人检测出乳腺肿瘤,恶性肿瘤有害并且十分危险,而良性的肿瘤危害就没那么大。

我们来看一组数据:

这个数据集中,横轴表示肿瘤的大小;纵轴上,标出1和0表示是或者不是恶性肿瘤。

如果是恶性则记为1,良性记为 0。



机器学习的问题就在于:估算出肿瘤是恶性的或是良性的概率,这就是一个分类问题。

分类指的是,我们试着推测出离散的输出值:0或1,良性或恶性,而事实上在分类问题中,输出可能不止两个值。


总结:

监督学习的基本思想是,我们数据集中的每个样本都有相应的“正确答案”,再根据这些样本作出预测。


3、案例分析

假设你经营着一家公司,你想开发学习算法来处理这两个问题:

1、你有一大批同样的货物,想象一下,你有上千件一模一样的货物等待出售,这时你想预测接下来的三个月能卖多少件?

2、你有许多客户,这时你想写一个软件来检验每一个用户的账户。对于每一个账户,你要判断它们是否曾经被盗过?

那这两个问题,它们属于分类问题、还是回归问题?


问题一: 是一个回归问题,如果我有数千件货物,我会把它看成一个实数,一个连续的值。因此卖出的物品数,也是一个连续的值。


问题二:是一个分类问题,因为我会把预测的值,用0 来表示账户未被盗,用1 表示账户曾经被盗过。所以我们根据账号是否被盗过,把它们定为0或 1,然后用算法推测一个账号是 0还是 1,因为只有少数的离散值,所以我把它归为分类问题。

相关文章
|
20天前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
【10月更文挑战第5天】如何用贝叶斯方法来解决机器学习中的分类问题?
|
26天前
|
机器学习/深度学习 存储 自然语言处理
【机器学习】基于逻辑回归的分类预测
【机器学习】基于逻辑回归的分类预测
|
14天前
|
机器学习/深度学习 算法 数据可视化
机器学习的核心功能:分类、回归、聚类与降维
机器学习领域的基本功能类型通常按照学习模式、预测目标和算法适用性来分类。这些类型包括监督学习、无监督学习、半监督学习和强化学习。
19 0
|
26天前
|
机器学习/深度学习 传感器 算法
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习、分类问题和逻辑回归的基本概念、步骤、特点以及多分类问题的处理方法
机器学习是人工智能的一个核心分支,它专注于开发算法,使计算机系统能够自动地从数据中学习并改进其性能,而无需进行明确的编程。这些算法能够识别数据中的模式,并利用这些模式来做出预测或决策。机器学习的主要应用领域包括自然语言处理、计算机视觉、推荐系统、金融预测、医疗诊断等。
56 1
|
3月前
|
机器学习/深度学习 算法
【机器学习】简单解释贝叶斯公式和朴素贝叶斯分类?(面试回答)
简要解释了贝叶斯公式及其在朴素贝叶斯分类算法中的应用,包括算法的基本原理和步骤。
70 1
|
3月前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
如何用贝叶斯方法来解决机器学习中的分类问题?
|
3月前
|
机器学习/深度学习 数据采集 自然语言处理
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4 机器学习LGB 方案
在讯飞英文学术论文分类挑战赛中使用LightGBM模型进行文本分类的方案,包括数据预处理、特征提取、模型训练及多折交叉验证等步骤,并提供了相关的代码实现。
48 0
|
5月前
|
机器学习/深度学习 算法
机器学习方法分类
【6月更文挑战第14天】机器学习方法分类。
73 2
|
5月前
|
机器学习/深度学习 分布式计算 算法
在机器学习项目中,选择算法涉及问题类型识别(如回归、分类、聚类、强化学习)
【6月更文挑战第28天】在机器学习项目中,选择算法涉及问题类型识别(如回归、分类、聚类、强化学习)、数据规模与特性(大数据可能适合分布式算法或深度学习)、性能需求(准确性、速度、可解释性)、资源限制(计算与内存)、领域知识应用以及实验验证(交叉验证、模型比较)。迭代过程包括数据探索、模型构建、评估和优化,结合业务需求进行决策。
54 0

热门文章

最新文章