入职之后接到的第一个代码任务是一个小测试。做一个文件单向同步软件。
需求描述:
将文件夹A内的文件夹和文件同步到文件夹B。
其实需求也就那么一句话,没啥还需要解释的了吧。详细点说,需要同步文件/文件夹的“新增,删除,重命名,修改”。
一开始我的想法是先Google,然后在博客园找到这篇文章《C#文件同步工具教程》。这篇文章的核心来自msdn里面FileSystemWatcher 的解释。就是用对象FileSystemWatcher 去监听文件是否被创建,重命名,删除,修改。如果发生了就调用相对应的事件,将被修改,创建,重命名的文件复制到目标目录B当中。这个例子比较简单,很多事情都没考虑到。而且我认为用FileSystemWatcher 去监听所有的文件,太浪费CPU和内存。
我的想法
是采用递归,遍历整个源目录,对比目标目录。
-
- 如果目标目录下没有相对应的文件,将文件复制到目标目录;
- 如果文件在两个路径下都存在,但是文件大小和最后写入时间不一致时,将原目录下的文件复制到目标目录下;
- 如果文件存在于目标目录下而不存在源目录下,则将目标路径下的文件删除。
实现
知道如何比较之后就可以进行递归遍历文件夹了。这个是这个软件实现的难点之一,其实也没多难,也就是说这个软件根本就没多难。以下是递归函数:
1 /// <summary> 2 /// 递归核心 同步目录 3 /// </summary> 4 /// <param name="src">原路径</param> 5 /// <param name="obj">目标路径</param> 6 static void loop(string src, string obj) // 递归核心 同步目录 7 { 8 CopyFistly(src, obj); //先同步文件 9 10 //遍历文件夹,递归调用 11 DirectoryInfo dirSrc = new DirectoryInfo(src); 12 DirectoryInfo[] dirs = dirSrc.GetDirectories(); 13 foreach (DirectoryInfo dir in dirs) 14 { 15 string str = dir.Name; 16 if (Directory.Exists(obj + "\\" + dir.Name) == false) 17 { 18 str = Directory.CreateDirectory(obj + "\\" + dir.Name).ToString(); 19 } 20 //注意这里,这里是递归,而且是下面要注意的地方 21 loop(src + "\\" + dir.ToString(), obj + "\\" + str); 22 } 23 }
测试了一下结果,在9000+个文件,40+个文件夹下,在我这部破机器上面单纯递归遍历(不复制文件)的时候需要的时间是截枝的十倍以上。简直是只乌龟。。。
优化
所以要想办法缩短时间提高效率。既然复制文件上面我们无法操作,那我们只好在递归上面进行优化。上个星期我发了一篇文章叫做《算法——回溯法》。这个时候刚好可以用上这种方法了。因为本身用的就是递归,而且文件夹的结构本身就是一个树的结构,在恰好满足了回溯法的要求。在遍历上面,并不需要在所有的文件夹都遍历一遍。因为有些文件夹并没有发生改变,所有就没有必要遍历下去了。所以就需要在递归调用自己之前先加一个条件,也就是加上约束函数。修改之后,代码如下:
1 /// <summary> 2 /// 递归核心 同步目录 3 /// </summary> 4 /// <param name="src">原路径</param> 5 /// <param name="obj">目标路径</param> 6 static void loop(string src, string obj) // 递归核心 同步目录 7 { 8 CopyFistly(src, obj); //先同步文件 9 10 //遍历文件夹,递归调用 11 DirectoryInfo dirSrc = new DirectoryInfo(src); 12 DirectoryInfo[] dirs = dirSrc.GetDirectories(); 13 foreach (DirectoryInfo dir in dirs) 14 { 15 string str = dir.Name; 16 if (Directory.Exists(obj + "\\" + dir.Name) == false) 17 { 18 str = Directory.CreateDirectory(obj + "\\" + dir.Name).ToString(); 19 } 20 DirectoryInfo dirObj = new DirectoryInfo(str); 21 //约束函数 在大小不一致的时候进行同步,其他状态不同步 22 if (GetDirectoryLength(src + "\\" + dir.ToString()) != GetDirectoryLength(obj + "\\" + str)) 23 loop(src + "\\" + dir.ToString(), obj + "\\" + str); 24 } 25 }
函数GetDirectoryLength(string path)的作用是检查文件夹path的大小。这里只是简单地对比两个文件夹的大小,如果大小一致,则截枝不递归,否则递归。这种方式的效率非常高,因为很多时候并不是都在有文件的复制,所以不需要经常去遍历目录。所以截枝就好了。下面给出GetDirectoryLength(string path)函数的代码。其实该函数也是一个递归,虽然会增加负荷,但是文件多,文件夹深的时候,是很有必要的。
难点主要在递归和截枝的思想上面。其他方面的解释可以直接查看代码。注释已经很清楚了。下面是整个文件的源代码:
配置文件的代码
因为要求用配置文件,配置原路径,目的路径等信息,有必要说明一下这个问题。另外需要读配置文件,所以需要引用System.Configuration;命名空间。一下是配置文件app.config代码:
<?xml version="1.0" encoding="utf-8" ?> <configuration> <appSettings> <!--原路径--> <add key="src" value="e:\test\a"/> <!--目标路径--> <add key="obj" value="e:\test\b"/> <!--日记文件路径--> <add key="logs" value="e:\test\logs.txt"/> <!--自动同步时间,单位为毫秒--> <add key="synTime" value="5000"/> </appSettings> </configuration>
效果:
希望本篇文章对你有所用处。
本文转自 Ron Ngai 博客园博客,原文链接:http://www.cnblogs.com/rond/archive/2012/07/19/2598489.html ,如需转载请自行联系原作者