Python sklearn实现K-means鸢尾花聚类

2022-11-08 313

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Python sklearn实现K-means鸢尾花聚类

✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。
🍎个人主页：小嗷犬的博客
🍊个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。
🥭本文内容：Python sklearn实现K-means鸢尾花聚类
更多内容请见👇

Python sklearn实现SVM鸢尾花分类

Pytorch 基于LeNet的手写数字识别

Pytorch 基于AlexNet的服饰识别（使用Fashion-MNIST数据集）

@TOC

准备

使用到的库：

numpy

matplotlib

sklearn

安装：

pip install numpy
pip install matplotlib
pip install sklearn

数据集：
使用开源数据集“鸢尾花数据集”。包含3种类型数据集，共150条数据；数据包含4项特征，花萼长度、花萼宽度、花瓣长度、花瓣宽度；将80%的数据划分为训练集，20%划分为测试集。
下载地址：
https://download.csdn.net/download/qq_63585949/86827472

对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇，让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。

1.导入相关包

import matplotlib.pyplot as plt
import numpy as np
from sklearn.cluster import KMeans 
from sklearn import datasets

2.直接从sklearn.datasets中加载数据集

# 直接从sklearn中获取数据集
iris = datasets.load_iris()
X = iris.data[:, :4]    # 表示我们取特征空间中的4个维度
print(X.shape)

3.绘制二维数据分布图

每个样本使用两个特征，绘制其二维数据分布图

# 取前两个维度（萼片长度、萼片宽度），绘制数据分布图
plt.scatter(X[:, 0], X[:, 1], c="red", marker='o', label='see')
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.legend(loc=2)
plt.show()

二维数据分布图

4.实例化K-means类，并且定义训练函数

def Model(n_clusters):
    estimator = KMeans(n_clusters=n_clusters)# 构造聚类器
    return estimator

def train(estimator):
    estimator.fit(X)  # 聚类

5.训练

# 初始化实例，并开启训练拟合
estimator=Model(3)     
train(estimator)

6.可视化展示

label_pred = estimator.labels_  # 获取聚类标签
# 绘制k-means结果
x0 = X[label_pred == 0]
x1 = X[label_pred == 1]
x2 = X[label_pred == 2]
plt.scatter(x0[:, 0], x0[:, 1], c="red", marker='o', label='label0')
plt.scatter(x1[:, 0], x1[:, 1], c="green", marker='*', label='label1')
plt.scatter(x2[:, 0], x2[:, 1], c="blue", marker='+', label='label2')
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.legend(loc=2)
plt.show()

7.预览图

K-means鸢尾花聚类

Python sklearn实现K-means鸢尾花聚类

准备

1.导入相关包

2.直接从sklearn.datasets中加载数据集

3.绘制二维数据分布图

4.实例化K-means类，并且定义训练函数

5.训练

6.可视化展示

7.预览图

热门文章

最新文章

相关课程

相关电子书

相关实验场景