出现中文乱码问题情况,详细如下!
在MyEclipse里

在Hadoop里

那么,如果是这样情况,说明是要改编码。
解决的办法?
1 、windows -> preferences

2、 将Text file encoding的other部分,改为UTF-8。

3、hadoop项目,右键,prpperties,然后出现以下界面。就是配置好了,即hadoop项目的消除中文乱码问题解决。
将Inherited from container(UTF-8)的Other改为UTF-8。

4、刷新,重新即可。将之前的salary.txt重新上传。


即,本地的MyEclipse中已经解决了乱码问题。
5、现在,需要到hadoop集群上去成功运行,这该怎么做呢?
Hadoop -> Export -> Export,

Java -> JAR file -> next

6、 因为,在hadoop里,这些依赖的架包是存在的,所以我们就不需要再多此一举再打包了。
为架包取一个名称,为SalaryCount.jar,先在D盘新建文件夹JAR,存放在D:\JAR\SalaryCount.jar


在D盘的JAR目录下,查看sc.jar

7、接下来,用xshell来连接CentOS6.5。


8、rz,打开D:\JAR\sc.jar ,上传至CentOS6.5


9、通过rz命令上传sc.jar包

10、 执行命令
hadoop jar sc.jar com.dajiangtai.hadoop.test.SalaryCount /salary/ /salary/out/

11 查看结果
hadoop fs -text /salary/out/part-r-00000

即,与在本地的MyEclipse的结果是一样的。
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/5077864.html,如需转载请自行联系原作者