使用Python实现K-means 算法-------文章中有源码

简介: 使用Python实现K-means 算法-------文章中有源码

一、实验目的

使用Python实现K-means 算法。

二、实验原理

(1)(随机)选择K个聚类的初始中心;

(2)对任意一个样本点,求其到K个聚类中心的距离,将样本点归类到距离最小的中心的聚类,如此迭代n次;

(3)每次迭代过程中,利用均值等方法更新各个聚类的中心点(质心);

(4)对K个聚类中心,利用2,3步迭代更新后,如果位置点变化很小(可以设置阈值),则认为达到稳定状态,迭代结束。

三、Python包

(1)numpy

四、实验内容

数据集如下:

[3.13257748 4.08653576]

[2.8486827 4.48815431]

[3.40882487 4.14138275]

[3.06977634 4.31563331]

[3.14381702 4.10147438]

[2.67195731 3.6464033 ]

[2.53242806 4.40165829]

[3.43557873 3.70279658]

[2.62401582 3.54597948]

[3.10216656 4.19867393]

[3.77207532 2.58221923]

[3.92348801 2.72714337]

[4.2845745 3.42431606]

[3.80646856 2.73666636]

[3.9872807 3.13824138]

[4.09143306 3.39424484]

[4.31901806 3.08375654]

[3.58912334 2.91815208]

[4.09898341 3.00657741]

[4.2702863 3.20399911]

试采用K-means 算法对其进行聚类(k为2)。

代码:


import numpy as np
import matplotlib.pyplot as plt
data=[[3.13257748,4.08653576],[2.8486827,4.48815431],
[3.40882487,4.14138275],[3.06977634,4.31563331],
[3.14381702,4.10147438],[2.67195731,3.6464033 ],
     [2.53242806,4.40165829],[3.43557873,3.70279658],
     [2.62401582,3.54597948], [3.10216656,4.19867393],
[3.77207532,2.58221923],[3.92348801,2.72714337],
    [4.2845745,3.42431606],[3.80646856,2.73666636],
[3.9872807,3.13824138],[4.09143306,3.39424484],
    [4.31901806,3.08375654],[3.58912334,2.91815208],
    [4.09898341,3.00657741],[4.2702863,3.20399911]]
Data=np.array(data)
plt.scatter(Data[:,0], Data[:,1],color = 'green', s = 200)
plt.show()
new_x1=[3.5,3.5]
new_x2=[4,2.5]
for i in range(100):
    temp1=[]
    temp2=[]
    for i in range(len(Data)):
        dis_1=sum((Data[i]-new_x1)**2)
        dis_2=sum((Data[i]-new_x2)**2)
        if dis_1>dis_2:
            temp1.append(Data[i])
        else:
            temp2.append(Data[i])
    temp1=np.array(temp1)
    temp2=np.array(temp2)
    new_x1=[]
    new_x1.append(np.average(temp1[:,0]))
    new_x1.append(np.average(temp1[:,1]))
    new_x2 = []
    new_x2.append(np.average(temp2[:, 0]))
    new_x2.append(np.average(temp2[:, 1]))
plt.scatter(temp1[:,0], temp1[:,1],color = 'green', s = 200)
plt.scatter(temp2[:,0], temp2[:,1],color = 'red', s = 200)
plt.show()

image.pngimage.png


目录
相关文章
|
3天前
|
搜索推荐 算法 C语言
【排序算法】八大排序(上)(c语言实现)(附源码)
本文介绍了四种常见的排序算法:冒泡排序、选择排序、插入排序和希尔排序。通过具体的代码实现和测试数据,详细解释了每种算法的工作原理和性能特点。冒泡排序通过不断交换相邻元素来排序,选择排序通过选择最小元素进行交换,插入排序通过逐步插入元素到已排序部分,而希尔排序则是插入排序的改进版,通过预排序使数据更接近有序,从而提高效率。文章最后总结了这四种算法的空间和时间复杂度,以及它们的稳定性。
29 8
|
3天前
|
搜索推荐 算法 C语言
【排序算法】八大排序(下)(c语言实现)(附源码)
本文继续学习并实现了八大排序算法中的后四种:堆排序、快速排序、归并排序和计数排序。详细介绍了每种排序算法的原理、步骤和代码实现,并通过测试数据展示了它们的性能表现。堆排序利用堆的特性进行排序,快速排序通过递归和多种划分方法实现高效排序,归并排序通过分治法将问题分解后再合并,计数排序则通过统计每个元素的出现次数实现非比较排序。最后,文章还对比了这些排序算法在处理一百万个整形数据时的运行时间,帮助读者了解不同算法的优劣。
21 7
|
3天前
|
算法 Python
在Python编程中,分治法、贪心算法和动态规划是三种重要的算法。分治法通过将大问题分解为小问题,递归解决后合并结果
在Python编程中,分治法、贪心算法和动态规划是三种重要的算法。分治法通过将大问题分解为小问题,递归解决后合并结果;贪心算法在每一步选择局部最优解,追求全局最优;动态规划通过保存子问题的解,避免重复计算,确保全局最优。这三种算法各具特色,适用于不同类型的问题,合理选择能显著提升编程效率。
18 2
|
1月前
|
存储 机器学习/深度学习 算法
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
蓝桥杯Python编程练习题的集合,涵盖了从基础到提高的多个算法题目及其解答。
51 3
蓝桥杯练习题(三):Python组之算法训练提高综合五十题
|
15天前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
56 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
19天前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
28天前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
50 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
1月前
|
算法 安全 Go
Python与Go语言中的哈希算法实现及对比分析
Python与Go语言中的哈希算法实现及对比分析
35 0
|
18天前
|
算法 安全 数据安全/隐私保护
基于game-based算法的动态频谱访问matlab仿真
本算法展示了在认知无线电网络中,通过游戏理论优化动态频谱访问,提高频谱利用率和物理层安全性。程序运行效果包括负载因子、传输功率、信噪比对用户效用和保密率的影响分析。软件版本:Matlab 2022a。完整代码包含详细中文注释和操作视频。
|
3天前
|
算法 数据挖掘 数据安全/隐私保护
基于FCM模糊聚类算法的图像分割matlab仿真
本项目展示了基于模糊C均值(FCM)算法的图像分割技术。算法运行效果良好,无水印。使用MATLAB 2022a开发,提供完整代码及中文注释,附带操作步骤视频。FCM算法通过隶属度矩阵和聚类中心矩阵实现图像分割,适用于灰度和彩色图像,广泛应用于医学影像、遥感图像等领域。
下一篇
无影云桌面