mahout学习进度

简介: 第一周已经报名成功视频下载完毕晚上回家看视频部署mahout:1. 书面作业没有完成2.

第一周已经报名成功视频下载完毕晚上回家看视频部署mahout:

1. 书面作业没有完成

2. 互动作业完成90% 计划2月8日晚上完成

http://www.dataguru.cn/myclassnew.php?mod=worklist&workid=1100&stuid=11391

3.参考资料

http://blog.fens.me/hadoop-mahout-maven-eclipse/

http://blog.fens.me/tag/eclipse/

目录
相关文章
|
分布式计算 算法 搜索推荐
Mahout学习系列之推荐算法
打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.
2006 0
|
算法 Java Apache
Mahout分类算法学习之实现Naive Bayes分类示例
1.简介 (1) 贝叶斯分类器的分类原理发源于古典概率理论,是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。朴素贝叶斯分类器(Naive Bayes Classifier)做了一个简单的假定:给定目标值时属性之间相互条件独立,即给定元组的类标号,假定属性值有条件地相互独立,即在属性间不存在依赖关系。
1542 0
|
算法 数据挖掘
Mahout学习之聚类算法Kmeans
一:kMeans算法介绍         聚类分析是一种静态数据分析方法,常被用于机器学习,模式识别,数据挖掘等领域。通常认为,聚类是一种无监督式的机器学习方法,它的过程是这样的:在未知样本类别的情况下,通过计算样本彼此间的距离(欧式距离,马式距离,汉明距离,余弦距离等)来估计样本所属类别。
1073 0
|
分布式计算 算法 Java
Mahout学习之运行canopy算法错误及解决办法
一:将Text转换成Vector序列文件时  在Hadoop中运行编译打包好的jar程序,可能会报下面的错误: Exception in thread "main" java.lang.
1112 0
|
分布式计算 Hadoop
Mahout学习之命令行创建序列文件
一:命令行转换 创建新的工作目录 mkdir lastfm mkdir ./lastfm/original export WORK_DIR=/home/thinkgamer/document/lastfm cd $WORK_DIR 自己准备一个数据集放在original文件夹下,例如将点击打开链接下边的数据保存在synthetic_control.
849 0
|
分布式计算 算法 数据挖掘
Mahout聚类算法学习之Canopy算法的分析与实现
3.1 Canopy算法3.1.1 Canopy算法简介     Canopy算法的主要思想是把聚类分为两个阶段:阶段一,通过使用一个简单、快捷的距离计算方法把数据分为可重叠的子集,称为“canopy”;阶段二,通过使用一个精准、严密的距离计算方法来计算出现在阶段一中同一个canopy的所有数据向量的距离。
1795 0
|
分布式计算 算法 数据挖掘
Mahout学习之Mahout简介、安装、配置、入门程序测试
原文地址:http://blog.csdn.net/aaronhadoop/article/details/24577221 一、Mahout简介 查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个Mahout)  步入正文啦:        Mahout 是一个
1430 0
mahout 学习
http://blog.fens.me/hadoop-mahout-recommend-job/ http://www.ttlsa.com/html/3771.html
913 0