在Java里处理文件的技巧

简介: update: 2016-8-4从URL转换为File的方法:1. 先判断URL是否是 file: 开头的2. 用 new File(url.toURI());  来转换为File注意,因为url当有空格时,会被转义为%20,所以要转换为URL,再转为File。


update: 2016-8-4

从URL转换为File的方法:

1. 先判断URL是否是 file: 开头的

2. 用 new File(url.toURI());  来转换为File

注意,因为url当有空格时,会被转义为%20,所以要转换为URL,再转为File。另外要注意处理这个转义时不能使用URLDecoder。

参考:http://stackoverflow.com/a/17870390


写这篇Blog,主要是因为看到太多的凌乱的,不安全的处理文件的代码了。甚至可以说每个项目都会有人喜欢写自己的一些FileUitl。。

下面介绍一些利用JDK7标准库来灵活处理文件的方法。

实用的工具类,Path,Paths,Files,FileSystem 

有一些很灵活的处理方法: 

		//得到一个Path对象
		Path path = Paths.get("/test/a.txt");
		//Path转换File
		File file = path.toFile();
		
		Files.readAllBytes(path);
		Files.deleteIfExists(path);
		Files.size(path);

正确拼接路径不要手动拼接路径

不好的代码: 

		String game = "foo";
		File file = new File("~/test/" + game + ".txt");
即使是要手动拼接路径,请使用下面两个平台无关的变量: 
		System.out.println(File.pathSeparator);
		System.out.println(File.separator);
正确简洁的方法是使用Paths类: 
		Path path = Paths.get("~/test/", "foo", "bar", "a.txt");
		System.out.println(path);
		//  ~/test/foo/bar/a.txt

读取文件的所有内容,文件的所有行

读取文件所有内容前,先判断文件大小,防止OOM。 

	public static byte[] readAllBytes(String fileName, long maxSize) throws IOException {
		Path path = Paths.get(fileName);
		long size = Files.size(path);
		if (size > maxSize) {
			throw new IOException("file: " + path + ", size:" + size + "> " + maxSize);
		}
		return Files.readAllBytes(path);
	}
	
	public static List<String> readAlllines(String fileName, Charset charset, long maxSize) throws IOException {
		Path path = Paths.get(fileName);
		long size = Files.size(path);
		if (size > maxSize) {
			throw new IOException("file: " + path + ", size:" + size + "> " + maxSize);
		}
		return Files.readAllLines(path, charset);
	}

利用JDK7的特性,auto close,远离一堆的catch, close

		Path path = Paths.get("~/test/", "foo", "bar", "a.txt");
		try (InputStream in = Files.newInputStream(path)) {
			// process
			//in.read();
		}

历遍目录

DK7新特性,FileVisitor 

public class MyFileVisitor extends SimpleFileVisitor<Path>{
	@Override
	public FileVisitResult visitFile(Path file, BasicFileAttributes attrs) throws IOException {
		System.out.println(file);
		return FileVisitResult.CONTINUE;
	}
	
	public static void main(String[] args) throws IOException {
		Path path = Paths.get("/home/user/test");
		Files.walkFileTree(path, new MyFileVisitor());
	}
}

判断文件是否在父路径下

网上流传一种递归判断parent的方式,http://stackoverflow.com/questions/18227634/check-if-file-is-in-subdirectory

但是查阅jdk代码后,发现getParent()函数是通过处理文件名得到的。所以直接比较文件前缀即可。 

请务必注意,file.getCanonicalPath()函数

	public static boolean isSubFile(File parent, File child) throws IOException {
		return child.getCanonicalPath().startsWith(parent.getCanonicalPath() + File.separator);
	}


	public static boolean isSubFile(String parent, String child) throws IOException {
		return isSubFile(new File(parent), new File(child));
	}

监视文件改变

JDK7新特性,但是API比较难用。TODO 

淘宝有个diamond的配置管理项目,是利用定时器不断去读取来文件是否改变的。

JDK7则是利用了linux的inotify机制。

Web服务器防止非法的文件路径访问

字符截断攻击和文件历遍漏洞原理:在文件名中插入%00的URL编码,web服务器会把%00后面的内容抛弃。 

例如这样的URL:http://www.test.com/../../../../etc/passwd%00.gif

防范方法

  • 写入文件前,判断文件是否在父路径下,参考上面的函数。 
  • 利用Java的安全机制 
// All files in /img/java can be read
grant codeBase "file:/home/programpath/" {
  permission java.io.FilePermission "/img/java", "read";
};
Tomcat的设置 
http://tomcat.apache.org/tomcat-7.0-doc/security-manager-howto.html

  • 静态资源不要自己手写代码去读取,尽量使用Web服务器或者Web框架的本身的静态资源映射功能。

比如Tomcat的默认自带的DefaultServlet:

<servlet-mapping>
    <servlet-name>default</servlet-name>
    <url-pattern>/static/*</url-pattern>
</servlet-mapping>
Spring mvc可以配置

<mvc:resources mapping="/resources/**" location="/public-resources/"/>
或者使用spring mvc里的DefaultServletHttpRequestHandler。这个默认优先级是最低的,也就是最后没人处理的URL会交给WebServer本身的default servlet去处理。比如Tomcat的就是上面所说的。

<mvc:default-servlet-handler/>
个人推荐使用DefaultServletHttpRequestHandler,因为Web容器的文件访问功能要比Spring mvc自身的要强大。比如Tomcat的DefaultServlet支持Etag,断点续传,缓存等。

参考:

http://docs.spring.io/spring/docs/current/spring-framework-reference/html/mvc.html

http://svn.apache.org/repos/asf/tomcat/trunk/java/org/apache/catalina/servlets/DefaultServlet.java


相关文章
|
12天前
|
分布式计算 DataWorks Java
DataWorks操作报错合集之在使用MaxCompute的Java SDK创建函数时,出现找不到文件资源的情况,是BUG吗
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
26 0
|
1月前
|
存储 缓存 安全
Java 中 IO 流、File文件
Java 中 IO 流、File文件
|
2月前
|
前端开发 Java
Java压缩20M文件非常厉害
Java压缩20M文件非常厉害
27 1
|
2月前
|
Java BI API
Java如何实现文件批量导入导出(兼容xls,xlsx)
Java如何实现文件批量导入导出(兼容xls,xlsx)
51 0
|
2月前
|
Java
有关Java发送邮件信息(支持附件、html文件模板发送)
有关Java发送邮件信息(支持附件、html文件模板发送)
47 1
|
17天前
|
Java Unix Windows
|
21天前
|
Java 关系型数据库 MySQL
Elasticsearch【问题记录 01】启动服务&停止服务的2类方法【及 java.nio.file.AccessDeniedException: xx/pid 问题解决】(含shell脚本文件)
【4月更文挑战第12天】Elasticsearch【问题记录 01】启动服务&停止服务的2类方法【及 java.nio.file.AccessDeniedException: xx/pid 问题解决】(含shell脚本文件)
55 3
|
2天前
|
Java 开发者
Java一分钟之-Java IO流:文件读写基础
【5月更文挑战第10天】本文介绍了Java IO流在文件读写中的应用,包括`FileInputStream`和`FileOutputStream`用于字节流操作,`BufferedReader`和`PrintWriter`用于字符流。通过代码示例展示了如何读取和写入文件,强调了常见问题如未关闭流、文件路径、编码、权限和异常处理,并提供了追加写入与读取的示例。理解这些基础知识和注意事项能帮助开发者编写更可靠的程序。
9 0
|
3天前
|
Java
JDK环境下利用记事本对java文件进行运行编译
JDK环境下利用记事本对java文件进行运行编译
10 0
|
5天前
|
Arthas 安全 Java
java服务报错 FileNotFoundException:打开的文件过多
java服务报错 FileNotFoundException:打开的文件过多
15 0