深度之眼(二十三)——Python:Sklearn库(上)

简介: 深度之眼(二十三)——Python:Sklearn库(上)

零、导读


0a2653c851af460fa595bd959398a8f1.png

scikit-learn库是当今最流行的机器学习算法库之一

可用来解决分类与回归问题

本章以鸢尾花数据集为例,简单了解八大传统机器学习分类算法的sk-learn实现

欲深入了解传统机器算法的原理和公式推导,请继续学习《统计学习方法》或《西瓜书》


一、数据集的预处理(鸢尾花数据集为例)


(1)下载数据集


iris = sns.load_dataset("iris")
iris.head()

0eacb84100b54626af849e6b562bf92a.png


(2)查看数据集


2d65d23f6d4748949b924e4057485923.png2e9b90b2ca334476abebe75bafe6eeaa.png


sns.pairplot(data=iris,hue="species")

0a2653c851af460fa595bd959398a8f1.png

(3)标签清洗


iris_sip = iris.drop(["sepal_length","sepal_width"],axis=1)
iris_sip.head()

0eacb84100b54626af849e6b562bf92a.png


(4)标签编码


from sklearn.preprocessing import LabelEncoder
encoder = LabelEncoder()
iris_sip["species"] = encoder.fit_transform(iris_sip["species"])
iris_sip

0a2653c851af460fa595bd959398a8f1.png


(5)数据集的标准化

0eacb84100b54626af849e6b562bf92a.png

(6)构建训练集和测试集

80% 是训练集

20% 是测试集

将x和y分开

0a2653c851af460fa595bd959398a8f1.png


二、八大传统分类算法


2.1 K邻近


[1]基本思想

与待预测点最近的训练数据集中的k个邻居

把k个近邻中最常见的类别预测为带预测点的类别


0eacb84100b54626af849e6b562bf92a.png2d65d23f6d4748949b924e4057485923.png2e9b90b2ca334476abebe75bafe6eeaa.png


(5)可视化

0a2653c851af460fa595bd959398a8f1.png


2.2 朴素贝叶斯

[1]基本思想

当X=(x1, x2)发生的时候,哪一一个yk发生的概率最大

0eacb84100b54626af849e6b562bf92a.png

可视化

0eacb84100b54626af849e6b562bf92a.png

相关文章
|
8天前
|
XML JSON 数据库
Python的标准库
Python的标准库
121 77
|
23天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
70 4
数据分析的 10 个最佳 Python 库
|
9天前
|
XML JSON 数据库
Python的标准库
Python的标准库
38 11
|
22天前
|
人工智能 API 开发工具
aisuite:吴恩达发布开源Python库,一个接口调用多个大模型
吴恩达发布的开源Python库aisuite,提供了一个统一的接口来调用多个大型语言模型(LLM)服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台,简化了多模型管理和测试的工作,促进了人工智能技术的应用和发展。
89 1
aisuite:吴恩达发布开源Python库,一个接口调用多个大模型
|
9天前
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
48 8
|
17天前
|
安全 API 文件存储
Yagmail邮件发送库:如何用Python实现自动化邮件营销?
本文详细介绍了如何使用Yagmail库实现自动化邮件营销。Yagmail是一个简洁强大的Python库,能简化邮件发送流程,支持文本、HTML邮件及附件发送,适用于数字营销场景。文章涵盖了Yagmail的基本使用、高级功能、案例分析及最佳实践,帮助读者轻松上手。
28 4
|
25天前
|
测试技术 Python
Python中的异步编程与`asyncio`库
Python中的异步编程与`asyncio`库
|
2月前
|
Python
pip批量安装Python库 requirement.txt 离线环境无互联网环境下pip安装Python库
pip批量安装Python库 requirement.txt 离线环境无互联网环境下pip安装Python库
155 3
|
6月前
|
开发工具 git Python
安装和使用`libnum`是一个用于数字理论函数的Python库
【6月更文挑战第19天】`libnum`是Python的数字理论函数库。安装可通过`git clone`,进入目录后运行`python setup.py install`,也可用`pip install libnum`。示例:使用`int_to_hex`将十进制数42转换为十六进制字符串'2a'。注意,信息可能已过时,应查最新文档以确保准确性。如遇问题,参考GitHub仓库或寻求社区帮助。
129 1
|
5月前
|
Python
确保你已经安装了`python-barcode`库。如果没有,可以通过pip来安装:
确保你已经安装了`python-barcode`库。如果没有,可以通过pip来安装: