文档备案控制台

开发者社区问答正文

在PAI上kmeans怎么循环传聚类数K，选取最佳的聚类数？

使用kmeans进行聚类，但需要先确定最佳的聚类数？
目前没有找到可以循环传参的方法？

展开

收起

wgy灬 2018-02-07 16:55:33 3224 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

4 条回答

写回答

取消提交回答

openrec

以我对问题的理解，提供一条可能可行的思路，但具体问题还是要具体分析的。首先需要有个可量化的聚类目标，不然计算机都不知道什么是最优的聚类，对吧？，其次，想做到参数的自动迭代，我目前知道的方案是shell脚本+odpscmd的方式。通过自动化脚本来遍历参数，就是时间上慢了点。

2019-07-17 21:58:19

赞同展开评论
ucmengxin

Kmeans确定最佳的cluster建议先做可视化，比如做过PAC投影出来看一看有没有明显的cluster。再其次的，无妨k值设定高一点，拿到cluster之后再看是否有非常小的cluster可以丢弃或者距离非常接近的cluster可以合并等等

2019-07-17 21:58:18

赞同展开评论
上头欢乐送

可以有组件分组功能里的参数循环
在实验中界面中，可以点击“框选节点”选中需要合并的组件，点击某一个组件点击鼠标右键选择“合并”
弹出命名对话框，输入分组名字，注意此时只是在画布上定义了一个分组，并没有保存到"我的分组"里
右击分组选择参数循环

2019-07-17 21:58:18

赞同展开评论
孤狼：

一个热爱科技，热爱生活的阳光男孩

1

2019-07-17 21:58:18

赞同展开评论

问答分类：

数据挖掘人工智能平台 PAI

问答标签：

机器学习平台 PAI聚类机器学习平台 PAI循环

问答地址：

开发者社区 > 大数据 > 问答

相关问答

机器学习PAI中Pipeline的二分均值聚类模型获取能聚类后的质心坐标吗

375

1

0

机器学习PAI alink里examples的means聚类算法示例本地能跑成功生产就不行为什？

146

1

0

机器学习PAI的Dbscan的聚类算法，没有吗？

126

1

0

机器学习这个组件是不是不可以分组做聚类输出？

447

1

0

机器学习中的聚类在实际生活中有什么用吗，举个例子？

2493

2

0

Python机器学习中在对鸢尾花数据集进行聚类时，出现与真值相比预测结果全部都是判断错误是为什么？

786

1

0

Python机器学习中该怎么对鸢尾花数据集进行聚类呢？

713

1

0

机器学习的K均值聚类算法使用的过程是什么呢？

536

1

0

机器学习进行聚类后在什么时候会结束呢？

519

1

0

机器学习里的K-Means聚类的好处是什么？

587

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

OpenClaw Gateway Token 获取？

阿里云千问Token价格怎么收费？

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

相关文章

告别传统 Text-to-SQL：基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

Python新手避坑指南：KeyError的“前世今生”与破解之道

企业如何把BI工具用好：从“看数据”到“用数据”的跨越

小龙虾 AI 🦞OpenClaw+Skills重构科研工作流，阿里云/本地零基础部署、科研 Skill 开发应用指南

还有其他疑问?