机器学习,你不得不掌握的十大算法(上篇)

简介: 我们知道,机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

● 机器学习及其分类

我们知道,机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。


按照学习方式进行分类,机器学习算法可分为监督式学习,非监督式学习和强化学习三种。


监督学习目的是使用有类标的训练数据构建模型,利用训练得到的模型对未来数据进行预测,监督是指训练数据集中每一个样本均有一个已知的输出项(类标,label)。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)

16.jpg


到监督式学习不得不提到分类,分类为监督式学习一个子类,目的是基于对过往类标已知示例的观察与学习,实现对新样本类标的预测。例如经典的检测垃圾邮件的例子,这是一个典型的二分类问题;又如数字识别,0-9十个数字的识别分类这是一个典型的多分类问题。


与监督式学习不一样,非监督式学习的对象大多是无类标或者总体分布趋势不明朗的数据。通过非监督式学习,在没有已知输出变量和反馈函数指导的情况下提取有效信息探索数据的整体结构。

17.jpg


就像非监督式学习和监督式学习相对一样,与分类相对应的是聚类。聚类是一种探索性数据分析技术,在没有任何相关先验信息情况下,将数据划分为有意义的小的组别(即簇,cluster)


与监督式学习、非监督式学习相并列的是强化学习。其目标是构建一个系统(Agent),在与环境(environment)交互过程中提高系统的性能。环境的当前状态信息中通常包含一个反馈信号。我们可以将强化学习视为与监督学习相关的一个领域。只不过,在强化学习中,这个反馈不是一个确定的类标或者连续类型的值,而是一个通过反馈函数产生的对当前系统行为的评价。


一个常用的强化学习例子就是棋类对弈游戏。在此,Agent根据棋盘上的当前局势(环境)决定落子位置,游戏结束胜负的判定可以作为激励信号。

18.jpg


● 十大机器学习算法

这里仅列举出机器学习中,不得不掌握的十大算法,具体介绍将在后期进行展开~

算法如下:

  • 决策树
  • 随机森林算法
  • 逻辑回归
  • SVM
  • 朴素贝叶斯
  • K最近邻算法
  • K均值算法
  • Adaboost算法
  • 神经网络
  • 马尔可夫


对于以上算法,大家掌握了多少呢?什么?还是小白一个?没事儿,下期小詹将展开生动详细的介绍噢~


相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
124 4
|
1天前
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
27 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
17天前
|
算法
PAI下面的gbdt、xgboost、ps-smart 算法如何优化?
设置gbdt 、xgboost等算法的样本和特征的采样率
41 2
|
2月前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
52 1
|
2月前
|
机器学习/深度学习 自然语言处理 算法
深入理解机器学习算法:从线性回归到神经网络
深入理解机器学习算法:从线性回归到神经网络
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
105 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 算法
深入探索机器学习中的决策树算法
深入探索机器学习中的决策树算法
43 0
|
2月前
|
机器学习/深度学习 算法 Python
机器学习入门:理解并实现K-近邻算法
机器学习入门:理解并实现K-近邻算法
40 0
|
11天前
|
机器学习/深度学习 算法
基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真
本项目基于改进遗传优化的BP神经网络进行金融序列预测,使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络,展示了三者的误差和预测曲线差异。核心程序结合遗传算法(GA)与BP神经网络,利用GA优化BP网络的初始权重和阈值,提高预测精度。GA通过选择、交叉、变异操作迭代优化,防止局部收敛,增强模型对金融市场复杂性和不确定性的适应能力。
145 80
|
4天前
|
机器学习/深度学习 算法
基于遗传优化的双BP神经网络金融序列预测算法matlab仿真
本项目基于遗传优化的双BP神经网络实现金融序列预测,使用MATLAB2022A进行仿真。算法通过两个初始学习率不同的BP神经网络(e1, e2)协同工作,结合遗传算法优化,提高预测精度。实验展示了三个算法的误差对比结果,验证了该方法的有效性。