机器学习的相关算法了解和总结

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
应用实时监控服务-可观测链路OpenTelemetry版,每月50GB免费额度
简介: 机器学习的相关算法了解和总结

@[toc]

机器学习的相关算法了解和总结


1、机器学习的一般步骤

训练集训练 -> 提取特征向量 -> 结合一定的算法(比如决策树、KNN) -> 得到结果

机器学习的几个核心主要是 分类、随机、决策、迭代、猜测

其实就是一个通过经验总结进行结果猜测的过程,那么,提供的
经验样本(训练数据)越多,优化(迭代)的越好,猜测的准确度就越高

2、相关算法

Adaboost 算法   
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),
然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)


K均值聚类算法
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法


最近邻算法 KNN
邻近算法,或者说K最邻近(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中
最简单的方法之一
所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值
来代表。近邻算法就是将数据集合中每一个记录进行分类的方法


朴素贝叶斯
朴素贝叶斯法(Naive Bayes model)是基于贝叶斯定理与特征条件独立假设的分类方法


逻辑回归分析
logistic回归 又称 logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,
疾病自动诊断,经济预测等领域
logistic回归 是一种概率分析模型,通过自变量和因变量推测某件事情发生(或者某种情况出现)
的概率


马尔可夫过程
马尔可夫过程(Markov process)是一类随机过程。它的原始模型马尔可夫链,
由俄国数学家A.A.马尔可夫于1907年提出

3、决策树

决策树(Decision Tree)是一种简单但是广泛使用的分类器,我们通过训练数据构建
决策树,可以高效的对未知的数据进行分类
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取
净现值的期望值大于等于零的概率,
评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种
决策分支画成图形很像一棵树的枝干,故称决策树
# 优点
1、决策树模型可以读性好,具有描述性,有助于人工分析
2、效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度
在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系
算法演进 ID3  C4.5  C5.0

4、支持向量机 SVM



支持向量机(Support Vector Machines,SVM)是一种二分类模型
它将实例的特征向量映射为空间中的一些点,SVM 的目的就是想要画出一条线,
以 “最好地” 区分这两类点,以至如果以后有了新的点,这条线也能做出很好的分类
SVM 适合中小型数据样本、非线性、高维的分类问题



SVM 通过点到向量线的垂直距离最大,从而得到一条最合适的划分线
但是样本的特征很可能是高纬度的,此时的样本空间划分就不是一条线了,此时称为超平面


但是很多情况下,样本是线性不可区分的,数据集在空间中对应的向量无法被一个超平面区
分开,那么此时,就需要通过把样本映射到高维空间中,比如三维、六维

一个 SVM 如果训练得出的支持向量个数比较少,那么SVM 训练出的模型比较容易被泛化


Python 的 SVM 可以通过 sklearn 来学习


核函数

求内积

5、神经网络

人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为
神经网络(NNs)或称作连接模型(Connection Model)
它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型


这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的



神经网络通过分类器推断某个输入是某个结果的概率,然后通过逐步微调参数(程序反复迭代),
使得推断(猜测)的结果无限趋近于真实情况

6、随机森林算法

随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树
而它的本质属于机器学习的一大分支——集成学习(Ensemble Learning)方法
成百上千棵决策树组成了森林

随机森林算法相较于其他算法,有很好的准确率,并且能有效的运行在大数据集上

相关的基础知识概念

1、信息、熵以及信息增益的概念
2、决策树
3、集成学习

随机森林的思想

森林中有很多的决策树,每棵树都是独立的。每棵决策树都可以发表自己对于某个问题的看法
少数优秀的决策树的决策结果,将获得更高的权重,从而组成一个强分类器
然后决策树对结果进行选举投票,来确认最终的结果

每棵决策树随机从训练集中抽取样本进行训练,这样,每棵树的训练集都是不同的,但是树的训练集里面可能含有重复的样本(样本抽取并不会减少样本库数量)
进行随机抽取样本训练的目的,是为了获得不同的决策树,但是不同的决策树的训练样本有一定的交集,这是为了防止所有的决策树对于某些事情的结果存在偏见

相关文章
|
7天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
23 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
28天前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
1月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
56 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
1月前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
|
1月前
|
机器学习/深度学习 算法 Python
探索机器学习中的决策树算法:从理论到实践
【10月更文挑战第5天】本文旨在通过浅显易懂的语言,带领读者了解并实现一个基础的决策树模型。我们将从决策树的基本概念出发,逐步深入其构建过程,包括特征选择、树的生成与剪枝等关键技术点,并以一个简单的例子演示如何用Python代码实现一个决策树分类器。文章不仅注重理论阐述,更侧重于实际操作,以期帮助初学者快速入门并在真实数据上应用这一算法。
|
16天前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的决策树算法
【10月更文挑战第29天】本文将深入浅出地介绍决策树算法,一种在机器学习中广泛使用的分类和回归方法。我们将从基础概念出发,逐步深入到算法的实际应用,最后通过一个代码示例来直观展示如何利用决策树解决实际问题。无论你是机器学习的初学者还是希望深化理解的开发者,这篇文章都将为你提供有价值的见解和指导。
|
1月前
|
机器学习/深度学习 算法 数据处理
EM算法对人脸数据降维(机器学习作业06)
本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
34 0
|
6月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
239 14
|
6月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)