快速入门Python机器学习(12)

简介: 快速入门Python机器学习(12)

7.5 多项式贝叶斯(MultinomialNB)


7.5.1 属性与方法



class sklearn.naive_bayes.MultinomialNB(*, alpha=1.0, fit_prior=True, class_prior=None)


属性

属性

解释

class_count_

ndarray of shape (n_classes,)拟合期间遇到的每个类的样本数。当提供时,该值由样本重量加权。

class_log_prior_

ndarray of shape (n_classes, )平滑的经验对数概率为每一类。

classes_

ndarray of shape (n_classes,)分类器已知的类标签。

coef_

ndarray of shape (n_classes, n_features)镜像的特点是把多项式解释为线性模型。

feature_count_

ndarray of shape (n_classes, n_features)拟合期间每个(类、特征)遇到的样本数。

feature_log_prob_

ndarray of shape (n_classes, n_features)当提供时,该值由样本重量加权。给定一类特征的经验对数概率Px|i|y)。

intercept_

ndarray of shape (n_classes,)镜像类logprior,用于将多项式nb解释为线性模型。

n_features_

n_features_int每个样本的特征数


方法

fit(X, y[, sample_weight])

根据Xy拟合多项式朴素贝叶斯

get_params([deep])

获取此估计器的参数。

partial_fit(X, y[, classes, sample_weight])

对一批样品进行增量拟合。

predict(X)

对测试向量X的数组执行分类。

predict_log_proba(X)

测试向量X的返回对数概率估计。

predict_proba(X)

测试向量X的返回概率估计。

score(X, y[, sample_weight])

返回给定测试数据和标签的平均精度。

set_params(**params)

设置此估计器的参数。


7.5.2多项式贝叶斯拟合make_blobs数据

def multinomialNB_for_make_blobs():
       myutil = util()
       X,y = make_blobs(n_samples=500,random_state=8,centers=8)
       X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=8)
       scaler = MinMaxScaler()
       scaler.fit(X_train)
       X_train = scaler.transform(X_train)
       X_test = scaler.transform(X_test)
       nb = MultinomialNB()
       nb.fit(X_train,y_train)
       title = "多项式贝叶斯 make_blobs"
       myutil.draw_scatter(X,y,nb,title)
       myutil.print_scores(nb,X_train,y_train,X_test,y_test,title)
       myutil.plot_learning_curve(MultinomialNB(),X,y,title)
       myutil.show_pic(title)


输出

多项式贝叶斯 make_blobs:
13.33%
多项式贝叶斯 make_blobs:
9.60%


由此可见,多项式贝叶斯拟合make_blobs数据是非常差的。

 image.png

image.png


7.5.3 多项式贝叶斯拟合鸢尾花数据

def multinomialNB_for_iris():
       warnings.filterwarnings("ignore")
       myutil = util()
       X,y = datasets.load_iris().data,datasets.load_iris().target
       X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=8)
       scaler = MinMaxScaler()
       scaler.fit(X_train)
       X_train = scaler.transform(X_train)
       X_test = scaler.transform(X_test)
       nb = MultinomialNB()
       nb.fit(X_train,y_train)
       title = "多项式贝叶斯 鸢尾花"
       myutil.print_scores(nb,X_train,y_train,X_test,y_test,title)
       myutil.plot_learning_curve(MultinomialNB(),X,y,title)
       myutil.show_pic(title)


输出

多项式贝叶斯 鸢尾花:
66.07%
多项式贝叶斯 鸢尾花:
65.79%


多项式贝叶斯拟合鸢尾花数据刚刚及格,不是很好。

image.png


7.5.4多项式贝叶斯拟合红酒数据

def multinomialNB_for_wine():
       warnings.filterwarnings("ignore")
       myutil = util()
       X,y = datasets.load_wine().data,datasets.load_wine().target
       X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=8)
       scaler = MinMaxScaler()
       scaler.fit(X_train)
       X_train = scaler.transform(X_train)
       X_test = scaler.transform(X_test)
       nb = MultinomialNB()
       nb.fit(X_train,y_train)
       title = "多项式贝叶斯 红酒"
       myutil.print_scores(nb,X_train,y_train,X_test,y_test,title)
       myutil.plot_learning_curve(MultinomialNB(),X,y,title)
       myutil.show_pic(title)


输出

多项式贝叶斯 红酒:
96.24%
多项式贝叶斯 红酒:
91.11%


多项式贝叶斯拟合红酒数据刚还是不错的。

image.png


7.5.5多项式贝叶斯拟合乳腺癌数据

def multinomialNB_for_breast_cancer():
       warnings.filterwarnings("ignore")
       myutil = util()
       X,y = datasets.load_breast_cancer().data,datasets.load_breast_cancer().target
       X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=8)
       scaler = MinMaxScaler()
       scaler.fit(X_train)
       X_train = scaler.transform(X_train)
       X_test = scaler.transform(X_test)
       nb = MultinomialNB()
       nb.fit(X_train,y_train)
       title = "多项式贝叶斯 乳腺癌"
       myutil.print_scores(nb,X_train,y_train,X_test,y_test,title)
       myutil.plot_learning_curve(MultinomialNB(),X,y,title)
       myutil.show_pic(title)


输出

多项式贝叶斯 乳腺癌:
84.27%
多项式贝叶斯 乳腺癌:
81.12%


多项式贝叶斯拟合乳腺癌数据还可以。


7.6 总结

7.6.1三个贝叶斯之间进行比较


算法

鸢尾花

红酒

乳腺癌

贝努利贝叶斯

33.04%/34.21%

41.35%/35.56%

63.85%/59.44%

高斯贝叶斯

98.21%/89.47%

99.25%/97.78%

94.37%/93.71%

多项式贝叶斯

66.07%/65.79%

96.24%/91.11%

84.27%/81.12%


看来,对三组数据高斯贝叶斯算法在三个数据中最好,我们让他与以前学习过的分类算法做个比较。


7.6.2与其他分类算法进行比较


算法

鸢尾花

红酒

乳腺癌

高斯贝叶斯

98.21%/89.47%

99.25%/97.78%

94.37%/93.71%

逻辑回归

96.67%/100.00%

100.00%/94.44%

94.95%/97.37%

K邻近分类算法

97.50%/96.67%

77.46%/72.22%

94.07%/95.61%


  • 对于鸢尾花数据,三个算法差不多;
  • 对于红酒数据,逻辑回归最好,K邻近分类算法最差;
  • 对于乳腺癌数据,三个算法差不多。
目录
相关文章
|
10月前
|
机器学习/深度学习 算法 Python
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习中一种重要的特征选择技术,通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。该方法从完整特征集出发,逐步剔除不重要的特征,最终保留最具影响力的变量子集。其优势包括提升模型简洁性和性能,减少过拟合,降低计算复杂度。然而,该方法在高维特征空间中计算成本较高,且可能陷入局部最优解。适用于线性回归、逻辑回归等统计学习模型。
400 7
|
8月前
|
机器学习/深度学习 人工智能 算法
Scikit-learn:Python机器学习的瑞士军刀
想要快速入门机器学习但被复杂算法吓退?本文详解Scikit-learn如何让您无需深厚数学背景也能构建强大AI模型。从数据预处理到模型评估,从垃圾邮件过滤到信用风险评估,通过实用案例和直观图表,带您掌握这把Python机器学习的'瑞士军刀'。无论您是AI新手还是经验丰富的数据科学家,都能从中获取将理论转化为实际应用的关键技巧。了解Scikit-learn与大语言模型的最新集成方式,抢先掌握机器学习的未来发展方向!
1105 12
Scikit-learn:Python机器学习的瑞士军刀
|
7月前
|
Linux 数据库 数据安全/隐私保护
Python web Django快速入门手册全栈版,共2590字,短小精悍
本教程涵盖Django从安装到数据库模型创建的全流程。第一章介绍Windows、Linux及macOS下虚拟环境搭建与Django安装验证;第二章讲解项目创建、迁移与运行;第三章演示应用APP创建及项目汉化;第四章说明超级用户创建与后台登录;第五章深入数据库模型设计,包括类与表的对应关系及模型创建步骤。内容精炼实用,适合快速入门Django全栈开发。
333 1
|
11月前
|
机器学习/深度学习 数据可视化 算法
Python与机器学习:使用Scikit-learn进行数据建模
本文介绍如何使用Python和Scikit-learn进行机器学习数据建模。首先,通过鸢尾花数据集演示数据准备、可视化和预处理步骤。接着,构建并评估K近邻(KNN)模型,展示超参数调优方法。最后,比较KNN、随机森林和支持向量机(SVM)等模型的性能,帮助读者掌握基础的机器学习建模技巧,并展望未来结合深度学习框架的发展方向。
Python与机器学习:使用Scikit-learn进行数据建模
|
10月前
|
机器学习/深度学习 数据可视化 TensorFlow
Python 高级编程与实战:深入理解数据科学与机器学习
本文深入探讨了Python在数据科学与机器学习中的应用,介绍了pandas、numpy、matplotlib等数据科学工具,以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目,如数据可视化和鸢尾花数据集分类,帮助读者掌握这些技术。最后提供了进一步学习资源,助力提升Python编程技能。
|
10月前
|
机器学习/深度学习 数据可视化 算法
Python 高级编程与实战:深入理解数据科学与机器学习
在前几篇文章中,我们探讨了 Python 的基础语法、面向对象编程、函数式编程、元编程、性能优化和调试技巧。本文将深入探讨 Python 在数据科学和机器学习中的应用,并通过实战项目帮助你掌握这些技术。
|
4月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
333 102
|
4月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
357 104
|
4月前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
286 103
|
4月前
|
机器学习/深度学习 人工智能 数据挖掘
Python:现代编程的首选语言
Python:现代编程的首选语言
212 82

推荐镜像

更多