开发者社区> 问答> 正文

在PAI上kmeans怎么循环传聚类数K,选取最佳的聚类数?

使用kmeans进行聚类, 但需要先确定最佳的聚类数?
目前没有找到可以循环传参的方法?

展开
收起
wgy灬 2018-02-07 16:55:33 2987 0
4 条回答
写回答
取消 提交回答
  • 以我对问题的理解,提供一条可能可行的思路,但具体问题还是要具体分析的。首先需要有个可量化的聚类目标,不然计算机都不知道什么是最优的聚类,对吧?,其次,想做到参数的自动迭代,我目前知道的方案是shell脚本+odpscmd的方式。通过自动化脚本来遍历参数,就是时间上慢了点。

    2019-07-17 21:58:19
    赞同 展开评论 打赏
  • Kmeans确定最佳的cluster建议先做可视化,比如做过PAC投影出来看一看有没有明显的cluster。再其次的,无妨k值设定高一点,拿到cluster之后再看是否有非常小的cluster可以丢弃或者距离非常接近的cluster可以合并等等

    2019-07-17 21:58:18
    赞同 展开评论 打赏
  • 可以有组件分组功能里的参数循环
    在实验中界面中,可以点击“框选节点”选中需要合并的组件,点击某一个组件点击鼠标右键选择“合并”
    弹出命名对话框,输入分组名字,注意此时只是在画布上定义了一个分组,并没有保存到"我的分组"里
    右击分组选择参数循环

    2019-07-17 21:58:18
    赞同 展开评论 打赏
  • 一个热爱科技,热爱生活的阳光男孩

    1

    2019-07-17 21:58:18
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
基于机器学习的阿里智能助理-- 在电商领域的架构构建与实践 立即下载
机器能预报多久后的天气——机器学习和可预报性 立即下载
PAI分布式机器学习平台 立即下载