机器学习系列(8)_回归算法,支持向量机

简介: 机器学习应用的领域非常广泛:数据挖掘:分析用户信息,提高用户对产品的依赖性。计算机视觉:无人驾驶汽车–实时进行检测任务

一、机器学习简介



机器学习应用的领域非常广泛:

  1. 数据挖掘:分析用户信息,提高用户对产品的依赖性。
  2. 计算机视觉:无人驾驶汽车–实时进行检测任务

image.png


机器学习的步骤:

1、训练样本

2、特征提取(数据科学家:知道一份数据如何是机器能更好的识别特征)

3、学习函数

4、预测


Numpy:科学计算库(矩阵)

Pandas:数据分析处理库(缺失值,异常值等数据分析处理)

Matplotlib:数据可视化库(画图)

Scikit-learn:机器学习库(机器学习)


二、回归算法



分类:最终得出的结果是一个类别

回归:最终的结果不是类别值,而是具体的值


例子:

根据工资和年龄来判断银行能够向该客户借多少钱。

由于最终的预测结果是一个具体的值,因此这是一个回归问题。

工资和年龄这两个指标称为特征,两个特征的影响程度是不一样的。

ea4156af4374499099421f32604876b1.png

a2749fb7f6a24a39be0acdabc9f8ee9a.png

关于线性回归的算法,大体上面是使用了概率论与数理统计当中的似然函数以及对数似然函数,具体过程就不展示了,目标函数如下:

88e0c707ac424afd9420aaa70c08c8f6.png

逻辑回归:

逻辑回归是经典的二分类问题,虽然是回归,但它得到的最终的结果是类别

ba69e1635dcb4dcbaf134c9ee6b39150.pngimage.png


关于梯度下降:梯度下降算法原理讲解——机器学习


三、支持向量机要解决的问题



支持向量机做的是分类任务,解决二分类问题。

支持向量机相比于决策树,不仅要分的纯,还要分的好,能够容忍的误差更大。

image.png

image.png


因此支持向量机要解决的问题就是找到最优的线,能最好的区分样本,进行分类。


四、支持向量机求解目标



根据上图,我们的目的是找到一条线,这条线要满足以下要求:

即下图

ea0d36cb69394f3da09fba4adf011da6.png61cfebe0740a4e36aba891aa30d5660b.png

下图中的X1,X3就是支持向量机算法当中的支持向量。

87c0077aef7b4038b5efff1fd489fa47.png

对于线性的支持向量机,只要找出这样一个超平面即可。

但是如果样本数据当中存在异常点,那么就需要舍去这个异常点。

观察下面的实线:由于包含了异常点,因此O和X都离线很近,但如果使用虚线,则OX离虚线较远,能更好的满足我们的需求。

a1341fd1416b481dbd6868884848ee59.png775d13429af54ad7b8f76253cf76602a.png


五、核函数变换



76a22e704a4546f9a2d613f93a185448.png

image.png


支持向量机就是通过一些核函数,将一些低维空间的数据,转化成高维空间的数据。


相关文章
|
3天前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机(SVM)算法
【5月更文挑战第6天】在数据科学和人工智能的广阔天地中,支持向量机(SVM)以其强大的分类能力与理论深度成为机器学习领域中的一个闪亮的星。本文将深入探讨SVM的核心原理、关键特性以及实际应用案例,为读者提供一个清晰的视角来理解这一高级算法,并展示如何利用SVM解决实际问题。
26 7
|
3天前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机算法
【5月更文挑战第6天】 在数据科学和人工智能领域,支持向量机(SVM)是一种强大的监督学习模型,它凭借其出色的分类能力在众多机器学习任务中占据重要地位。本文旨在深入剖析支持向量机的工作原理,探讨其在高维数据处理中的优势以及面对大规模数据集时的应对策略。通过对核技巧、软间隔以及优化问题的讨论,我们将揭示SVM如何优雅地处理线性不可分问题,并保持模型的泛化性能。
|
7天前
|
机器学习/深度学习 自然语言处理 算法
机器学习算法原理与应用:深入探索与实战
【5月更文挑战第2天】本文深入探讨机器学习算法原理,包括监督学习(如线性回归、SVM、神经网络)、非监督学习(聚类、PCA)和强化学习。通过案例展示了机器学习在图像识别(CNN)、自然语言处理(RNN/LSTM)和推荐系统(协同过滤)的应用。随着技术发展,机器学习正广泛影响各领域,但也带来隐私和算法偏见问题,需关注解决。
|
9天前
|
机器学习/深度学习 运维 算法
【Python机器学习专栏】异常检测算法在Python中的实践
【4月更文挑战第30天】本文介绍了异常检测的重要性和在不同领域的应用,如欺诈检测和网络安全。文章概述了四种常见异常检测算法:基于统计、距离、密度和模型的方法。在Python实践中,使用scikit-learn库展示了如何实现这些算法,包括正态分布拟合、K-means聚类、局部异常因子(LOF)和孤立森林(Isolation Forest)。通过计算概率密度、距离、LOF值和数据点的平均路径长度来识别异常值。
|
2月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
|
1月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
2月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
30 1
|
2月前
|
机器学习/深度学习 数据采集 算法
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
151 0
|
2月前
|
机器学习/深度学习 数据采集 监控
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
94 0
|
2月前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机(SVM)算法
【2月更文挑战第20天】 在数据科学与人工智能的领域中,支持向量机(SVM)是一种强大的监督学习算法,它基于统计学习理论中的VC维理论和结构风险最小化原理。本文将深入探讨SVM的核心概念、工作原理以及实际应用案例。我们将透过算法的数学原理,揭示如何利用SVM进行有效的数据分类与回归分析,并讨论其在处理非线性问题时的优势。通过本文,读者将对SVM有更深层次的理解,并能够在实践中应用这一算法解决复杂的数据问题。
21 0

热门文章

最新文章