学习笔记: 机器学习经典算法-决策边界(decision boundary)

简介: 机器学习经典算法-个人笔记和学习心得分享

1、决策边界

在分类问题中,决策边界(Decision boundaries) 的几何含义表示为一个超曲面 (线性分类的边界为超平面),该 曲面 将特征空间中的样本按样本类别分布将它们划分分开。

1.2 简单逻辑回归的决策边界

逻辑回归算法改进于线性回归算法;在线性回归中,计算的模型参数 $\theta$ 描述了样本特征对样本输出标记的贡献程度; 在逻辑回归中,样本特征通过通过模型参数$\theta$转换为样本标记值并通过 Sigmoid 函数转换为样本分类概率值,具有如下关系:
$$ \hat y = \left\{ \begin{aligned} 0,\ \ \ \hat p \le 0.5,\ \ \ \theta^T\cdot x_b > 0; \\ 1,\ \ \ \hat p \ge 0.5,\ \ \ \theta^T\cdot x_b < 0; \end{aligned} \right. $$
这里,$\hat y$ 分类为 0 或 1 取决于 $ \theta^T\cdot x_b $大于或小于 0,从而 逻辑回归的决策边界 为描述方程 $ \theta^T\cdot x_b = 0$ 所在超平面 。

样本集仅包两个特征 $x_1,x_2$,那么就有该数据集的决策边界描述方程表示为 $\theta_0 + \theta_1x_1 + \theta_2x_2 = 0$,该决策边界在样本的特征空间(二维平面)表现为一条直线:

落在决策边界上侧区域的样本分类为 1,决策边界下侧区域的样本分类为 0,落在决策边界上的样本预测概率值为 $\hat p = 0.5$ ,分类既可以是 0 也可以是 1

1.2 不规则决策边界的绘制方法

通用方法: 在特征空间创建均匀分布的点集,使用模型对所有点集进行分类预测并作色,即可显示特征空间上的 决策曲面(超平面),对无论是否可以获取 决策面描述方程 的算法模型都适用。

kNN算法模型的决策边界(典型无法获取 决策面描述方程 的模型)

kNN算法 的预测结果仅取决于其k个邻居的投票,如果这个k个邻居本身就是存在错误测量,就会影响算法的预测结果准确度。所以对于超参数$k$ 就有 $k$ 越小,模型的泛化能力越弱,表现为方差大,模型复杂度高,对训练集处于 过拟合状态。 这种模型的 高复杂度 在决策边界上表现为弯曲杂乱(上图 k_neighbors = 5 所示); 当增加邻居数目到 k_neighbors = 50 ,kNN算法模型的整体复杂度降低,此时的 决策边界在空间块上划分具有规整明显的特点

目录
相关文章
|
4月前
|
机器学习/深度学习 存储 算法
决策树和随机森林在机器学习中的应用
在机器学习领域,决策树(Decision Tree)和随机森林(Random Forest)是两种非常流行且强大的分类和回归算法。它们通过模拟人类决策过程,将复杂的数据集分割成易于理解和处理的子集,从而实现对新数据的准确预测。
145 10
|
21天前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
111 15
|
2月前
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
169 1
|
4月前
|
机器学习/深度学习 数据采集 监控
探索机器学习:从数据到决策
【9月更文挑战第18天】在这篇文章中,我们将一起踏上一段激动人心的旅程,穿越机器学习的世界。我们将探讨如何通过收集和处理数据,利用算法的力量来预测未来的趋势,并做出更加明智的决策。无论你是初学者还是有经验的开发者,这篇文章都将为你提供新的视角和思考方式。
|
4月前
|
机器学习/深度学习 算法 Python
从菜鸟到大师:一棵决策树如何引领你的Python机器学习之旅
【9月更文挑战第9天】在数据科学领域,机器学习如同璀璨明珠,吸引无数探索者。尤其对于新手而言,纷繁复杂的算法常让人感到迷茫。本文将以决策树为切入点,带您从Python机器学习的新手逐步成长为高手。决策树以其直观易懂的特点成为入门利器。通过构建决策树分类器并应用到鸢尾花数据集上,我们展示了其基本用法及效果。掌握决策树后,还需深入理解其工作原理,调整参数,并探索集成学习方法,最终将所学应用于实际问题解决中,不断提升技能。愿这棵智慧之树助您成为独当一面的大师。
56 3
|
4月前
|
机器学习/深度学习 算法 Python
决策树下的智慧果实:Python机器学习实战,轻松摘取数据洞察的果实
【9月更文挑战第7天】当我们身处数据海洋,如何提炼出有价值的洞察?决策树作为一种直观且强大的机器学习算法,宛如智慧之树,引领我们在繁复的数据中找到答案。通过Python的scikit-learn库,我们可以轻松实现决策树模型,对数据进行分类或回归分析。本教程将带领大家从零开始,通过实际案例掌握决策树的原理与应用,探索数据中的秘密。
59 1
|
5月前
|
机器学习/深度学习 算法 数据挖掘
【白话机器学习】算法理论+实战之决策树
【白话机器学习】算法理论+实战之决策树
101 0
|
8月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
262 14
|
8月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
149 1
|
8月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)