前言
日常使用电脑时,我们总会遇到磁盘空间不足的问题——手动查找大文件、删除冗余数据不仅效率低,传统单线程清理工具还存在扫描慢、操作不直观的痛点。今天给大家分享一款我基于 Python + PyQt6 开发的高性能磁盘清理工具「TurboClean」,它通过多进程加速扫描/删除操作,搭配可视化界面,让磁盘清理变得高效又简单。
代码已经开源在Github,如果觉得有用的话可以点个Star,万分感谢!https://github.com/ChenAI-TGF/TurboClean
一、工具核心亮点
TurboClean专为解决传统磁盘清理工具的痛点而生,核心优势如下:
- 🚀 多进程加速:利用多核CPU并行处理,扫描/删除速度远超单线程工具;
- 🎯 多深度扫描:支持快速/深度/全量三种扫描模式,兼顾速度与精细度;
- 🖥️ 可视化操作:PyQt6打造的友好界面,详细展示文件/文件夹大小,支持批量选择删除;
- 🌍 跨平台兼容:适配Windows/Linux/macOS,无系统限制;
项目地址:https://github.com/ChenAI-TGF/TurboClean
二、界面展示
TurboClean的界面布局简洁且功能完整,主要分为三大区域:
1. 顶部控制区
- 路径选择:支持手动输入或点击「浏览」选择待扫描文件夹;
- 扫描模式:下拉框选择「快速模式(仅1层)」「深度模式(前3层)」「全量模式(所有层级)」;
- 进程数设置:可自定义1-128个进程(默认8个,适配多数CPU多核场景);
- 扫描按钮:一键启动多进程扫描,按钮置灰避免重复触发。
2. 中间树形展示区
- 以树形结构展示文件/文件夹,列包括「名称」「占用大小」「完整路径」;
- 自动按大小降序排列,大文件/文件夹优先显示,便于快速定位;
- 文件夹支持展开/折叠,未预扫描的层级会实时计算大小,兼顾性能与体验;
- 支持Ctrl/Shift多选,满足批量操作需求。
3. 底部进度与操作区
- 两个进度条分别显示「扫描进度」「删除进度」,实时反馈处理状态;
- 「添加并执行删除」按钮:选中项后点击,二次确认后批量删除,删除成功后自动从列表移除。
三、核心功能详解
1. 多模式扫描功能
扫描是磁盘清理的核心,TurboClean针对不同场景设计了三种模式:
- 快速模式:仅扫描选定路径下第一层文件/文件夹,秒级出结果,适合快速定位大文件夹;
- 深度模式:扫描前3层内容,平衡速度与深度,满足多数清理需求;
- 全量模式:递归扫描所有层级,适合精细清理(如查找深藏的冗余小文件合集)。
扫描逻辑优化:
- 采用
os.scandir()替代os.listdir(),遍历文件效率提升30%+; - 多进程池分发扫描任务,每个进程负责一个子路径的扫描,避免单进程阻塞;
- 扫描结果缓存到内存,展开文件夹时直接读取,无需重复计算。
2. 安全批量删除功能
- 批量操作:支持多选文件/文件夹,一次删除多个目标;
- 安全确认:删除前弹出确认框,提示“删除后无法恢复”,避免误操作;
- 异常处理:删除失败(如文件被占用、权限不足)时,仅跳过该文件,不中断整体任务;
- 实时反馈:删除进度条实时更新,删除完成后弹窗提示,列表自动移除已删除项。
3. 性能优化设计
- 进程数可控:用户可根据CPU核心数调整进程数(建议不超过核心数×2),避免进程过多导致调度开销;
- UI无阻塞:扫描/删除任务放在QThread中执行,搭配多进程,保证界面始终响应;
- 懒加载:树形列表仅加载当前展开层级的内容,避免一次性加载大量数据导致界面卡顿。
四、代码设计核心知识点
这款工具的代码设计涵盖多个Python/PyQt6关键知识点,适合初学者学习参考:
1. QThread + 多进程:避免UI阻塞
PyQt的UI操作必须在主线程执行,而扫描/删除是耗时操作,因此采用「QThread封装多进程」的架构:
- 扫描任务
ScanWorker、删除任务DeleteWorker继承QThread,作为任务调度层; - 耗时的扫描/删除逻辑通过
multiprocessing.Pool实现多进程并行; - 用
pyqtSignal信号将进度、结果传递给主线程,更新UI(如进度条、树形列表)。
核心代码片段:
class ScanWorker(QThread): progress = pyqtSignal(int) finished = pyqtSignal(dict) def run(self): # 多进程池分发扫描任务 with Pool(processes=self.process_count) as pool: for i, res_dict in enumerate(pool.imap_unordered(scan_wrapper, task_args)): final_data.update(res_dict) self.progress.emit(int((i + 1) / total * 100)) self.finished.emit(final_data)
2. os.scandir():高效文件遍历
相较于os.listdir(),os.scandir()返回的DirEntry对象包含文件属性(如是否为文件/文件夹),无需额外调用os.stat(),大幅提升遍历效率:
def get_dir_size_limitless(path): total = 0 try: with os.scandir(path) as it: for entry in it: if entry.is_file(follow_symlinks=False): total += entry.stat().st_size elif entry.is_dir(follow_symlinks=False): total += get_dir_size_limitless(entry.path) except Exception: pass return total
3. 树形控件动态加载
为避免一次性加载大量数据导致界面卡顿,采用「展开时动态加载」策略:
- 初始仅加载扫描路径下第一层内容;
- 监听
itemExpanded信号,用户展开文件夹时,再加载该文件夹的子项; - 优先读取缓存的扫描结果,无缓存时实时计算,兼顾性能与完整性。
4. 异常处理:提升鲁棒性
工具中对文件操作的关键环节都做了异常捕获:
- 扫描时跳过无权限访问的文件/文件夹;
- 删除时跳过被占用的文件,返回失败状态;
- 路径不存在、空目录等边界场景均做了处理,避免程序崩溃。
五、快速上手使用
1. 环境准备
# 安装依赖 pip install PyQt6 # 克隆项目(替换为实际链接) git clone https://github.com/ChenAI-TGF/TurboClean.git cd TurboClean
2. 运行工具
python parallel_purge.py
3. 基础操作流程
- 选择待扫描路径 → 配置扫描模式和进程数 → 点击「开始扫描」;
- 扫描完成后,在树形列表中选中要删除的文件/文件夹;
- 点击「添加并执行删除」,确认后等待删除完成即可。
六、总结与展望
TurboClean结合了PyQt6的可视化优势和多进程的性能优势,解决了传统磁盘清理工具的核心痛点。从技术角度,它涵盖了「多进程/多线程协作」「高效文件IO」「PyQt控件封装」「异常处理」等多个实用知识点,适合Python开发者学习参考。
未来可拓展的方向:
- 增加文件类型筛选(如仅显示视频/日志文件);
- 支持文件/文件夹的右键菜单(如打开所在目录、重命名);
- 增加扫描结果导出(如CSV格式);
- 打包为免安装的可执行文件,降低非技术用户的使用门槛。
如果你也有磁盘清理的需求,或者想学习PyQt6+多进程的实战开发,欢迎前往GitHub仓库Star、Fork,也欢迎提交Issue和PR共同优化!
代码已经开源在Github,如果觉得有用的话可以点个Star,万分感谢!https://github.com/ChenAI-TGF/TurboClean