【文件IO】实现:查找文件并删除、文件复制、递归遍历目录查找文件

简介: 【文件IO】实现:查找文件并删除、文件复制、递归遍历目录查找文件

一、文件查找并删除

扫描指定⽬录,并找到名称中包含指定字符的所有普通⽂件(不包含⽬录),并且后续询问⽤⼾是否 要删除该⽂件

一个主要的操作就是需要扫描指定目录(递归)

递归函数

  1. 首先判断是否是目录,若不是,直接返回
  2. 若是,则列出当前目录的文件名,放到 files 数组中
  3. 如果 files 是空的,或者 files 数组长度为 0,代表没有文件,则直接返回
  4. 循环遍历 files数组
  1. 若此时遍历到的文件是普通文件
  • 调用删除文件方法 doDelete
  1. 若磁石遍历到的仍是目录
  • 继续递归
public class Demo15 {  
    //递归目录的方法  
    private static void scan(File currentFile, String key) {  
        if(!currentFile.isDirectory()){  
            return;  
        }        
        File[] files = currentFile.listFiles();  
        if(files == null || files.length == 0){  
            return;  
        }        
        for(File f : files){  
            if(f.isFile()){  
                doDelete(f,key);  
            }else {  
                scan(f,key);  
            }        
        }    
    }
}

删除函数

  1. 文件名中不包含关键字,则直接返回
  2. 若包含,则提示用户,是否进行删除
  3. 用户输入 Y/N 进行选择
  4. 若输入为 Y y,则将此文件删除
private static void doDelete(File f, String key){  
    if(!f.getName().contains(key)){  
        return;  
    }    
    Scanner scanner = new Scanner(System.in);  
    System.out.println(f.getAbsolutePath()+"是否确定要删除 Y/N");  
    String choice = scanner.next();  
    if(choice.equals("Y") || choice.equals("y")) {  
        f.delete();  
    }
}

完整代码

import java.io.File;  
import java.util.Scanner;  
  
public class Demo15 {  
    //递归目录的方法  
    private static void scan(File currentFile, String key) {  
        if(!currentFile.isDirectory()){  
            return;  
        }        
        File[] files = currentFile.listFiles();  
        if(files == null || files.length == 0){  
            return;  
        }        
        for(File f : files){  
            if(f.isFile()){  
                doDelete(f,key);  
            }else {  
                scan(f,key);  
            }        
        }    
    }
    private static void doDelete(File f, String key){  
        if(!f.getName().contains(key)){  
            return;  
        }        
        Scanner scanner = new Scanner(System.in);  
        System.out.println(f.getAbsolutePath()+"是否确定要删除 Y/N");  
        String choice = scanner.next();  
        if(choice.equals("Y") || choice.equals("y")) {  
            f.delete();  
        }    
    }  
    public static void main(String[] args) {  
        System.out.println("请输入要搜索的路径:");  
        Scanner scanner = new Scanner(System.in);  
        String rootPath = scanner.next();  
        File rootFile = new File(rootPath);  
        if(!rootFile.isDirectory()){  
            System.out.println("输入的路径不存在");  
            return;  
        }        
        System.out.println("请输入要删除的文件名字的关键字:");  
        String key = scanner.next();  
  
        //进行递归查找  
        scan(rootFile,key);  
    }
}

二、文件复制

进⾏普通⽂件的复制

把一个文件里面的每个字节都读出来,再写入另一个文件中

  1. 输入源文件路径,并实例出一个 srcFile 对象
  2. 判断这个对象是否是一个文件,若不是,则返回
  3. 若是,则继续输入目标文件的路径
  4. 以这个路径实例化出一个 dextFile 文件
  5. 得到这个文件所在处的父目录,并判断其是否是一个目录
  6. 若是,则开始执行复制的过程
  • 通过 InputStream 进行读操作,OutputStream 进行写操作
import java.io.*;  
import java.util.Scanner;  
  
public class Demo16 {  
    public static void main(String[] args) throws IOException {  
        Scanner scanner = new Scanner(System.in);  
        System.out.println("请输入源文件路径:");  
        String srcPath = scanner.next();  
        File srcFile = new File(srcPath);  
        if(!srcFile.isFile()){  
            System.out.println("源文件路径有误!");  
            return;  
        }        
        System.out.println("请输入目标文件路径");  
        String destPath = scanner.next();  
        File destFile = new File(destPath);  
        if(!destFile.getParentFile().isDirectory()) {  
            System.out.println("输入的目标文件路径有误!");  
            return;  
        }  
        try(InputStream inputStream = new FileInputStream(srcFile);  
            OutputStream outputStream = new FileOutputStream(destFile)){  
            while (true) {  
                byte[] buffer = new byte[1024];  
                int n = inputStream.read(buffer);  
                if(n == -1){  
                    break;  
                }                
                outputStream.write(buffer,0,n);  
            }        
        }catch (IOException e){  
            e.printStackTrace();  
        }    
    }
}
  • try() 里面可以写多个对象,多个对象的构造过程使用 ; 分隔就可以了
  • 写入的时候,不能直接write(buffer),因为前面读操作不一定能把buffer填满,若直接写入buffer,就把没有用到的空间也写入了,不太合适
  • 也许 buffer 只填了 100 个空间,剩下 924 个空间都是 0,写入就没有意义
  • 此时我们就需要指定空间写入[0, n]

三、递归遍历目录查找文件

扫描指定⽬录,并找到名称或者内容中包含指定字符的所有普通⽂件(不包含⽬录) 注意:我们现在的⽅案性能较差,所以尽量不要在太复杂的⽬录下或者⼤⽂件下实验

import java.io.*;  
import java.util.Scanner;  
  
  
  
public class Demo17 {  
    public static void main(String[] args) {  
        Scanner scanner = new Scanner(System.in);  
        System.out.println("请输入要搜索的路径:");  
        String rootPath = scanner.next();  
        File rootFile = new File(rootPath);  
        if(!rootFile.isDirectory()){  
            System.out.println("要搜索的路径有误!");  
            return;  
        }        
        System.out.println("请输入要搜索的查询词:");  
        String key = scanner.next();  
  
        //进行递归查找  
        scan(rootFile,key);  
    }  
    private static void scan(File rootFile, String key) {  
        if(!rootFile.isDirectory()) {  
            return;  
        }        
        File[] files = rootFile.listFiles();  
        if(files.length == 0 || files == null) {  
            return;  
        }        
        for(File f : files) {  
            if(f.isFile()){  
                //进行后续的查询操作  
                doSearch(f,key);  
            }else{  
                scan(f,key);  
            }        
        }    
    }  
  
    private static void doSearch(File f, String key) {  
        //打开文件,读取文件内容,并判定文件内容是否包含 key        
        StringBuilder stringBuilder = new StringBuilder();  
        //因为不考虑二进制,直接按照文本的方式来处理,就直接用 Reader        
        try(Reader reader = new FileReader(f)){  
            char[] buffer = new char[1024];  
            while(true) {  
                int n = reader.read(buffer);  
                if(n == -1){  
                    break;  
                }                
                String s = new String(buffer,0,n);  
                stringBuilder.append(s);  
            }        
        }catch (IOException e){  
            e.printStackTrace();  
        }        
        if(stringBuilder.indexOf(key) == -1) {  
            //未找到  
            return;  
        }        
        //找到了  
        System.out.println("找到匹配的文件" + f.getAbsolutePath());  
    }
}
  • 这个代码逻辑效率很低,每次查询都会涉及到大量的硬盘 IO 操作,因为每次判定都要将硬盘里面的所有文件都读一遍。尤其是遇到硬盘上有些大的文件
  • 这种思路不能适应频繁查询场景,也不能适应目录中文件数目特别多,特别大的场景

咱们搜索引擎中,进行搜索的过程,也就是在文件中查找内容是否被包含的过程

搜索出来的结果其实就是一些 HTML 文件,这些 HTML 文件里面一定是包含你的查询词(或者和你的查询词有关的)

搜索引擎每次搜索都是在数以十亿,数以百亿的 HTMl 中,找到几十万,几百万个结果

搜索引擎这样的场景,不能通过上述“遍历文件”方式实现

  • 其中最核心的优化,是引入了神奇的数据结构——倒排索引
  • 提前把所有的文件,里面的内容都分析好,分析出一个文件中,包含哪些词,再基于这个结果,得到另一份数据,每个词都在哪些文件中包含着
  • 之后就是一个查询哈希表的过程
  • 主要的难点就是这个哈希表如何来

在未来实际工作中,也会用到一些“自定制的搜索引擎”

比如,我们自己的代码中,产生大量的日志,把这些日志导入到自己搭建的搜索引擎中,从而快速查找

  • 用到一些业界成熟的方案,比如 ES(倒排索引原理) 这种


相关文章
|
24天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
16天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
20天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2577 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
18天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
3天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
2天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
163 2
|
20天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1576 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
22天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
977 14
|
4天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
221 2
|
17天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
734 9