文档备案控制台

开发者社区问答正文

如何使用pickle进行k-means聚类

现在我正在学习k-means聚类我想要使用pickle来转储和加载我训练过的模型如何做到这一点。

我的代码是：

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import pickle
from sklearn.cluster import KMeans
from sklearn.externals import joblib

# importing our dataset
dataset = pd.read_csv("Mall_Customers.csv")
X = dataset.iloc[:, [3,4]].values

# Applying k-means to the mall dataset
kmeans = KMeans(n_clusters=5, init='k-means++',random_state=0)
y_kmeans = kmeans.fit_predict(X)

# Visualising the clusters
plt.scatter(X[y_kmeans == 0, 0], X[y_kmeans == 0, 1], s = 100, c = 'red', label = 'Cluster 1')
plt.scatter(X[y_kmeans == 1, 0], X[y_kmeans == 1, 1], s = 100, c = 'blue', label = 'Cluster 2')
plt.scatter(X[y_kmeans == 2, 0], X[y_kmeans == 2, 1], s = 100, c = 'green', label = 'Cluster 3')
plt.scatter(X[y_kmeans == 3, 0], X[y_kmeans == 3, 1], s = 100, c = 'cyan', label = 'Cluster 4')
plt.scatter(X[y_kmeans == 4, 0], X[y_kmeans == 4, 1], s = 100, c = 'magenta', label = 'Cluster 5')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s = 300, c = 'yellow', label = 'Centroids')
plt.title('Clusters of customers')
plt.xlabel('Annual Income (k$)')
plt.ylabel('Spending Score (1-100)')
plt.legend()
plt.show()
我的问题：

如何使用泡菜进行转储和装载？
如何使用pickle预测新的聚类值。这意味着我要传递两个整数值一个=>工资，两个=>得分取决于此我需要新的输出像这两个是在哪个集群像tha

展开

收起

一码平川MACHEL 2019-02-28 14:28:21 3155 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

一码平川MACHEL

保存：
pickle.dump(kmeans, open("save.p", "wb"))
加载：
kmeans = pickle.load(open("save.p", "rb"))

2019-07-17 23:29:46

赞同展开评论

问答分类：

数据挖掘 Python

问答地址：

开发者社区 > 大数据 > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136735

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11268

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268718

11

0

#支付宝授权提示请在支付宝客户端打开链接

18939

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87492

49

0

this xml file does not appear to have any style in

55101

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35767

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3270

18

0

轻量级应用服务器端口问题（打不开）

32409

21

0

LoRa的网络覆盖能力范围是怎么样的？

4312

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

OpenClaw Gateway Token 获取？

阿里云千问Token价格怎么收费？

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

相关文章

好用的电商API接口推荐（技术员实操版）

爬虫跑了一小时还没完？换成列表推导式，我提前下班了

【龙虾ai保姆级教程】AI助手OpenClaw 阿里云/本地部署+免费大模型api配置及常见问题解答

利用淘宝开放平台API获取商品评论数据

多语言技术栈如何共用IP离线库？Java、Python、Go 的加载实践

还有其他疑问?