R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据

2024-04-28 199

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据

全文链接：http://tecdat.cn/?p=31070

最近，在贝叶斯统计实验中，我们向客户演示了用R的朴素贝叶斯分类器可以提供的内容（点击文末“阅读原文”获取完整代码数据）。

这个实用的例子介绍了使用R统计环境的朴素贝叶斯模型。它不假设先验知识。

相关视频

(7D426XZ@XIF}T4MHZU9M{I.png

我们的步骤是：

1.启动R

2.探索Iris鸢尾花数据集

3.构造朴素贝叶斯分类器

4.理解朴素贝叶斯

探索Iris数据集

在这个实践中，我们将探索经典的“Iris”数据集。

Iris数据集有150个数据点和5个变量。每一个数据点包含一个特定的花样本，并给出4种花的测量值。

任务是用花的特征与种类一起构建一个分类器，从4种对花的观测量中预测花的种类。

要将Iris数据集放到您的R会话中，请执行以下操作：

data(iris)

查看数据

pairs(iris[1:4],main="

`%()4)A%]C9X_01S4@PDE04.png

命令创建了一个散点图。类决定数据点的颜色。从中可以看出，setosa花的花瓣比其他两种都要小。

点击标题查阅往期内容

$Y_A{YSBIYI[U@AG)TP8B99F.png$

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间

左右滑动查看更多

)62663VYU66DF`@E$$EE$QI.png

O1P6~D`{JQ6[MO`K%XCA7`E.png

GZ{NGO4S{574GAZE6J((W3M.png

$REN2IJ_Y2IHD4{I}GMM`_IX.png$

提供数据摘要

summary(iris)

1W9]RMO0@SINTDSQH~)RFEV.png

构造朴素贝叶斯分类器

我们构建一个朴素的贝叶斯分类器。

(1)加载到工作区

(2)构建朴素贝叶斯分类器，

(3)对数据进行一些预测，执行以下操作：

library(e1071)  
classifier<-naiveBayes(iris[,1:4], iris[,5])  
table(predict(classifier, iris[,-5]), iris[,5], dnn=list('predicted','actual'))

F1]_(LTE4POC~SNXYFPN)5R.png

正如你应该看到的那样，分类器在分类方面做得很好。

J~G$8MZ0KJMGWL42$S45VH3.png

这给出了数据中的类分布：类的先验分布。(“先验”是拉丁语，表示“从前开始”)。

由于这里的预测变量都是连续的，朴素贝叶斯分类器为每个预测变量生成三个Giaussian(正态分布)分布：一个用于类变量的每个值。

您将看到3个依赖于类的高斯分布的平均值(第一列)和标准偏差(第二列)：

D(RY2TAZLZA0MXQ}U~2HAN3.png

绘制成图：

plot(function(x) dnorm, 0, 8, col=2, main="3种不同物种的花瓣长度分布")
curve(

${057YFJRKWR923F_ZXYIPJX.png$

值得注意的是，setosa irises(蓝色曲线)花瓣较小(平均值=1.462)，花瓣长度变化较小(唐氏偏差仅为0.1736640)。

理解朴素贝叶斯

在这个问题中，您必须计算出对于一些离散数据，朴素贝叶斯模型的参数应该是什么。

该数据集被称为HairEyeColor，有三个变量：性别、眼睛和头发，给出了某大学592名学生的这3个变量的值。首先看一下数字：

9Z19@W}%XT3%3QI}Z]1EH}O.png

您还可以将其绘制为“马赛克”图，它使用矩形来表示数据中的数字：

%L_C1QQ}%`]OV2GH25V0FEW.png

你在这里的工作是为一个朴素贝叶斯分类器计算参数，它试图从另外两个变量中预测性别。参数应该使用最大似然性来估计。为了节省手工计算的繁琐时间，下面是如何使用Edge.table来获取所需的计数

6N6QD3B5Y}%1GI0X98M~V25.png

naiveBayes(Sex ~

M9Q[LV6BLA40HLD)75N}W6C.png

预测

E~5HHJ3N4$Z4DNKBW[1J8SB.png

{A3]{PAAS73M%Y]NZRQ6@(E.png

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据》。

R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据

我们的步骤是：

探索Iris数据集

查看数据

构造朴素贝叶斯分类器

绘制成图：

理解朴素贝叶斯

预测

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据

我们的步骤是：

探索Iris数据集

查看数据

构造朴素贝叶斯分类器

绘制成图：

理解朴素贝叶斯

预测

热门文章

最新文章

相关课程

相关电子书