在PAI上kmeans怎么循环传聚类数K,选取最佳的聚类数?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

在PAI上kmeans怎么循环传聚类数K,选取最佳的聚类数?

wgy灬 2018-02-07 16:55:33 1213

使用kmeans进行聚类, 但需要先确定最佳的聚类数?
目前没有找到可以循环传参的方法?

数据挖掘
分享到
取消 提交回答
全部回答(4)
  • openrec
    2019-07-17 21:58:19

    以我对问题的理解,提供一条可能可行的思路,但具体问题还是要具体分析的。首先需要有个可量化的聚类目标,不然计算机都不知道什么是最优的聚类,对吧?,其次,想做到参数的自动迭代,我目前知道的方案是shell脚本+odpscmd的方式。通过自动化脚本来遍历参数,就是时间上慢了点。

    0 0
  • ucmengxin
    2019-07-17 21:58:18

    Kmeans确定最佳的cluster建议先做可视化,比如做过PAC投影出来看一看有没有明显的cluster。再其次的,无妨k值设定高一点,拿到cluster之后再看是否有非常小的cluster可以丢弃或者距离非常接近的cluster可以合并等等

    0 0
  • 上头欢乐送
    2019-07-17 21:58:18

    可以有组件分组功能里的参数循环
    在实验中界面中,可以点击“框选节点”选中需要合并的组件,点击某一个组件点击鼠标右键选择“合并”
    弹出命名对话框,输入分组名字,注意此时只是在画布上定义了一个分组,并没有保存到"我的分组"里
    右击分组选择参数循环

    0 0
  • 孤狼:
    2019-07-17 21:58:18

    1

    0 0
添加回答
+ 订阅

大数据计算实践乐园,近距离学习前沿技术

推荐文章
相似问题
推荐课程