Mahout学习之运行canopy算法错误及解决办法-阿里云开发者社区

Mahout学习之运行canopy算法错误及解决办法

2015-10-11 1242

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 一：将Text转换成Vector序列文件时在Hadoop中运行编译打包好的jar程序，可能会报下面的错误： Exception in thread "main" java.lang.

一：将Text转换成Vector序列文件时

在Hadoop中运行编译打包好的jar程序，可能会报下面的错误：

Exception in thread "main" java.lang.NoClassDefFoundError:
org/apache/mahout/common/AbstractJob

书中和网上给的解决办法都是：把Mahout根目录下的相应的jar包复制到Hadoop根目录下的lib文件夹下，同时重启Hadoop

但是到了小编这里不管怎么尝试，都不能解决，最终放弃了打包成jar运行的念头，就在对源码进行了修改，在eclipse运行了

二：java.lang.Exception: java.lang.ClassCastException: org.apache.hadoop.io.IntWritable cannot be cast to org.apache.hadoop.io.Text

此种错误，是由于map和reduce端函数格式输入输出不一致，导致数据类型不匹配

在次要注意一个特别容易出错的地方：Mapper和Reducer类中的函数必须是map和reduce，名字不能改，因为是继承Mapper类和Reducer类，如果函数名字改变了的话也可能造成以上的错误，或者Reducer端不输出

三：当在命令行里直接用命令转化文件格式时抛出如下错误：

ERROR common.AbstractJob: Unexpected --seqFileDir while processing Job-Specific Options

注：转化命令为：bin/mahout clusterdump --seqFileDir /home/thinkgamer/document/canopy/output/clusters-0-final/ --pointsDir /home/thinkgamer/document/canopy/output/clusteredPoints/ --output /home/thinkgamer/document/canopy/clusteranalyze.txt

上网搜了搜热心的网友给出的解决办法是：将--seqFileDir换成--input即可

Mahout学习之运行canopy算法错误及解决办法

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Mahout学习之运行canopy算法错误及解决办法

热门文章

最新文章

相关课程

相关电子书