本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.5.2节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.5.2 动手实践:K-Means算法实现
编写单机版的K-Means算法有利于理解Hadoop实现的K-Means算法,所以这里给出单机版(Java)的编写步骤,供读者参考。
实验步骤如下:
1)打开Eclipse,新建Java工程kmeans1.0;
2)参考前面的流程完善K-means代码;
3)使用测试数据hadoop/data/kmeans.data进行测试,查看结果;
4)思考把该算法转换为Hadoop MapReduce实现的思路。