Mahout学习之命令行创建序列文件

简介: 一:命令行转换 创建新的工作目录 mkdir lastfm mkdir ./lastfm/original export WORK_DIR=/home/thinkgamer/document/lastfm cd $WORK_DIR 自己准备一个数据集放在original文件夹下,例如将点击打开链接下边的数据保存在synthetic_control.

一:命令行转换

创建新的工作目录

mkdir lastfm

mkdir ./lastfm/original

export WORK_DIR=/home/thinkgamer/document/lastfm

cd $WORK_DIR

自己准备一个数据集放在original文件夹下,例如将点击打开链接下边的数据保存在synthetic_control.data中进行转换,首先将其放在origiinal文件夹中

进入mahout的安装目录,前提是hadoop环境是启动的

cd /usr/local/hadoop/mahout

bin/mahout seqdirectory -i $WORK_DIR/original -o $WORK_DIR/sequencesfile

然后进入$WORK_DIR目录下有一个sequencesfile文件夹

cd $WORK_DIR

cd sequencesfile

ls

会显示如下:

part-m-00000  _SUCCESS

命令行查看part-m-00000的文件内容为:

bin/mahout seqdumper -i $WORK_DIR/sequencesfile/part-m-00000 | more0

二:mapreduce转换

具体请参考mahout运行canopy程序中的程序:点击打开链接

三:命令行转换为文本文件

bin/mahout seqdumper -i $WORK_DIR/sequencesfile/part-m-00000 -o $WORK_DIR/clusteranalyzer

mahout版本不同如果上边的不好使,换用下边的

bin/mahout seqdumper -s $WORK_DIR/sequencesfile/part-m-00000 -o $WORK_DIR/clusteranalyzer

相关文章
|
分布式计算 算法 搜索推荐
Mahout学习系列之推荐算法
打开微信扫一扫,关注微信公众号【数据与算法联盟】 转载请注明出处:http://blog.csdn.net/gamer_gyt 博主微博:http://weibo.com/234654758 Github:https://github.
2121 0
|
算法 Java Apache
Mahout分类算法学习之实现Naive Bayes分类示例
1.简介 (1) 贝叶斯分类器的分类原理发源于古典概率理论,是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。朴素贝叶斯分类器(Naive Bayes Classifier)做了一个简单的假定:给定目标值时属性之间相互条件独立,即给定元组的类标号,假定属性值有条件地相互独立,即在属性间不存在依赖关系。
1594 0
|
算法 数据挖掘
Mahout学习之聚类算法Kmeans
一:kMeans算法介绍         聚类分析是一种静态数据分析方法,常被用于机器学习,模式识别,数据挖掘等领域。通常认为,聚类是一种无监督式的机器学习方法,它的过程是这样的:在未知样本类别的情况下,通过计算样本彼此间的距离(欧式距离,马式距离,汉明距离,余弦距离等)来估计样本所属类别。
1118 0
|
分布式计算 算法 Java
Mahout学习之运行canopy算法错误及解决办法
一:将Text转换成Vector序列文件时  在Hadoop中运行编译打包好的jar程序,可能会报下面的错误: Exception in thread "main" java.lang.
1156 0
|
分布式计算 算法 数据挖掘
Mahout聚类算法学习之Canopy算法的分析与实现
3.1 Canopy算法3.1.1 Canopy算法简介     Canopy算法的主要思想是把聚类分为两个阶段:阶段一,通过使用一个简单、快捷的距离计算方法把数据分为可重叠的子集,称为“canopy”;阶段二,通过使用一个精准、严密的距离计算方法来计算出现在阶段一中同一个canopy的所有数据向量的距离。
1885 0
|
分布式计算 算法 数据挖掘
Mahout学习之Mahout简介、安装、配置、入门程序测试
原文地址:http://blog.csdn.net/aaronhadoop/article/details/24577221 一、Mahout简介 查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个Mahout)  步入正文啦:        Mahout 是一个
1478 0
|
Android开发
mahout学习进度
第一周已经报名成功视频下载完毕晚上回家看视频部署mahout: 1. 书面作业没有完成 2.
853 0
mahout 学习
http://blog.fens.me/hadoop-mahout-recommend-job/ http://www.ttlsa.com/html/3771.html
934 0