在伪分布模式下测试代码,在eclipse里建了个项目,然后在map函数里我想从hdfs中读取文件数据(testData.csv),然后这几段代码就会出现问题,String str_url="hdfs://localhost:9000";URI.creat(str_url);String str="hdfs://localhost:9000/user/input/testData.csv";Path path=new Path(str);
我发现如果是str="/user/input/testData.csv";Path=new Path(str);就不会出现问题,但是这个路径是不存在的。
因为有两个文件需要读取,不知道怎么处理啊
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
import org.apache.hadoop.fs.FileSystem;这个包 有两种方式 调用
FileSystem.get(arg0, arg1);
FileSystem.get(conf);
String uri = "hdfs://bigdata/tmp/1.txt";
Configuration conf = new Configuration();
FileSystem fs = FileSystem.get(URI.create(uri), conf);
或者
FileSystem fs = FileSystem.get(conf);