【数据挖掘】朴素贝叶斯分类讲解及对iris数据集分类实战(超详细 附源码)

简介: 【数据挖掘】朴素贝叶斯分类讲解及对iris数据集分类实战(超详细 附源码)

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理(Bayes Theorem)为基础,采用了概率推理方法

算法原理

贝叶斯定理提供了一种计算假设概论的方法

朴素贝叶斯分类

贝叶斯分类算法在处理文档分类核垃圾邮件过滤有较好的分类效果

高斯朴素贝叶斯分类

原始的朴素贝叶斯分类只能处理离散数据,当处理连续变量的时候,可以使用高斯朴素贝叶斯完成分类人物,处理连续数据时,一种经典的假设是与每个类相关的连续变量是服从高斯分布的

高斯朴素贝叶斯公式如下

下面利用上面这个公式通过身高、体重和脚长数据来判定一个人是男性还是女性,身体特征的统计数据如下表所示

根据朴素贝叶斯公式,计算两两变量之间的后验概率,由于身高 体重 脚长都是连续变量,不能采用离散变量的方法计算概率,而且由于样本太少,所以也无法区分成区间计算,这时可以假设男性和女性的身高,体重和脚长都服从高斯分布,通过样本计算出均值和方差

多项式朴素贝叶斯分类

多项式朴素贝叶斯(Multinomial Naïve Bayes)经常被用于处理多分类问题,比起原始的朴素贝叶斯分类效果有了较大的提升。其公式如下

朴素贝叶斯分类应用

Scikit-learn模块中有Naïve Bayes子模块,包含了各种贝叶斯算法。关键在于将分类器设置为朴素贝叶斯分类器,接着调用分类器训练并进行分类

下面对Iris数据集进行朴素贝叶斯分类

结果如下 大致可以分为六类

代码如下

from sklearn.datasets import load_iris
from sklearn.naive_bayes import GaussianNB
iris = load_iris()
clf = GaussianNB()#设置高斯贝叶斯分类器
clf.fit(iris.data,iris.target)#训练分类器
y_pred = clf.predict(iris.data)#预测
print("Number of mislabeled points out of %d points:%d" %(iris.data.shape[0],(iris.target!= y_pred).sum()))

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
6月前
|
数据采集 数据可视化 数据挖掘
数据挖掘实战:使用Python进行数据分析与可视化
在大数据时代,Python因其强大库支持和易学性成为数据挖掘的首选语言。本文通过一个电商销售数据案例,演示如何使用Python进行数据预处理(如处理缺失值)、分析(如销售额时间趋势)和可视化(如商品类别销售条形图),揭示数据背后的模式。安装`pandas`, `numpy`, `matplotlib`, `seaborn`后,可以按照提供的代码步骤,从读取CSV到数据探索,体验Python在数据分析中的威力。这只是数据科学的入门,更多高级技术等待发掘。【6月更文挑战第14天】
638 11
|
6月前
|
数据采集 机器学习/深度学习 数据可视化
数据挖掘实战:Python在金融数据分析中的应用案例
Python在金融数据分析中扮演关键角色,用于预测市场趋势和风险管理。本文通过案例展示了使用Python库(如pandas、numpy、matplotlib等)进行数据获取、清洗、分析和建立预测模型,例如计算苹果公司(AAPL)股票的简单移动平均线,以展示基本流程。此示例为更复杂的金融建模奠定了基础。【6月更文挑战第13天】
1640 3
|
6月前
|
人工智能 分布式计算 算法
数据挖掘实战随笔更新清单
这是一系列技术博客的摘要,涵盖了多个主题。包括Elasticsearch实战经验、Maxcompute中的Geohash转换和GPS处理、Python环境配置与管理(如Jupyter、Miniforge、Miniconda)、批量接口调用、多进程CSV图片下载、Excel到Markdown转换、Scikit-learn的异常检测(OC-SVM)和模型总结、人工智能领域的图像分类和识别、文本挖掘算法以及数仓相关的行转列处理。所有文章都在持续更新和补充中。
51 2
|
7月前
|
数据可视化 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
|
7月前
|
算法 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
|
7月前
|
机器学习/深度学习 数据采集 算法
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
|
7月前
|
数据采集 算法 搜索推荐
数据挖掘实战:基于KMeans算法对超市客户进行聚类分群
数据挖掘实战:基于KMeans算法对超市客户进行聚类分群
1049 0

热门文章

最新文章

下一篇
DataWorks