出现中文乱码问题情况,详细如下!
在MyEclipse里
在Hadoop里
那么,如果是这样情况,说明是要改编码。
解决的办法?
1 、windows -> preferences
2、 将Text file encoding的other部分,改为UTF-8。
3、hadoop项目,右键,prpperties,然后出现以下界面。就是配置好了,即hadoop项目的消除中文乱码问题解决。
将Inherited from container(UTF-8)的Other改为UTF-8。
4、刷新,重新即可。将之前的salary.txt重新上传。
即,本地的MyEclipse中已经解决了乱码问题。
5、现在,需要到hadoop集群上去成功运行,这该怎么做呢?
Hadoop -> Export -> Export,
Java -> JAR file -> next
6、 因为,在hadoop里,这些依赖的架包是存在的,所以我们就不需要再多此一举再打包了。
为架包取一个名称,为SalaryCount.jar,先在D盘新建文件夹JAR,存放在D:\JAR\SalaryCount.jar
在D盘的JAR目录下,查看sc.jar
7、接下来,用xshell来连接CentOS6.5。
8、rz,打开D:\JAR\sc.jar ,上传至CentOS6.5
9、通过rz命令上传sc.jar包
10、 执行命令
hadoop jar sc.jar com.dajiangtai.hadoop.test.SalaryCount /salary/ /salary/out/
11 查看结果
hadoop fs -text /salary/out/part-r-00000
即,与在本地的MyEclipse的结果是一样的。
本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/5077864.html,如需转载请自行联系原作者