用python转移小文件到指定目录并压缩,脚本封装

简介: 这篇文章介绍了如何使用Python脚本将大量小文件转移到指定目录,并在达到大约250MB时进行压缩。

需求

有一个大文件夹,里面有10万个小文件,有10G。需要转成小压缩包,每个压缩包250M左右。

分析

1、判断指定文件夹的大小;
2、转移文件,指定文件夹到250M时停止转移;
3、将指定文件夹进行压缩。

脚本如下

import os
import shutil
import time

ORIGINAL_PATH = f"/Users/Desktop/amyfiles/temp/"
SAVE_PATH = f'/Users/Desktop/amyfiles/temp/my_data/'


def get_folder_size(folder_path):
    """获取文件夹的大小"""
    total_size = 0
    for path, dirs, files in os.walk(folder_path):
        for f in files:
            fp = os.path.join(path, f)
            total_size += os.path.getsize(fp)
        size_m = int(total_size / (1024 * 1024))
        return size_m


def start():
    # for i in range(1, 100):
    #     final_path = f'{SAVE_PATH}/20231107_{i}'
    final_path = f'{SAVE_PATH}/20231107_1'
    if not os.path.exists(final_path):
        os.makedirs(final_path)
    for path, dirs, files in os.walk(ORIGINAL_PATH):
        for num, f in enumerate(files):
            # 判断文件夹大小
            folder_size = get_folder_size(folder_path=final_path)
            # 文件夹中的总文件大于250M停止移动
            if folder_size and folder_size > 250:
                break

            # 转移文件
            shutil.move(f'{ORIGINAL_PATH}/{f}', f'{final_path}/{f}')
            time.sleep(0.01)
            print(f'{num}, 已转移: {f}, 当前 {final_path} 大小: {folder_size}M')

    # base_name:压缩打包后的文件名或者路径名
    # format: 压缩或者打包格式 "zip", "tar", "bztar", "gztar"
    # root_dir : 将哪个目录或者文件打包(也就是源文件)
    shutil.make_archive(base_name=final_path, format='zip', root_dir=final_path)


if __name__ == '__main__':
    start()
相关文章
|
4月前
|
JSON 算法 API
深度分析小红书城API接口,用Python脚本实现
小红书作为以UGC内容为核心的生活方式平台,其非官方API主要通过移动端抓包解析获得,涵盖内容推荐、搜索、笔记详情、用户信息和互动操作等功能。本文分析了其接口体系、认证机制及请求规范,并提供基于Python的调用框架,涉及签名生成、登录态管理与数据解析。需注意非官方接口存在稳定性与合规风险,使用时应遵守平台协议及法律法规。
|
4月前
|
JSON API 数据安全/隐私保护
【干货满满】分享微店API接口到手价,用python脚本实现
微店作为知名社交电商平台,其开放平台提供商品查询、订单管理等API接口。本文介绍如何通过微店API获取商品到手价(含优惠、券等),涵盖认证机制、Python实现及关键说明。
|
4月前
|
JSON API 数据格式
深度分析大麦网API接口,用Python脚本实现
大麦网为国内领先演出票务平台,提供演唱会、话剧、体育赛事等票务服务。本文基于抓包分析其非官方接口,并提供Python调用方案,涵盖演出列表查询、详情获取及城市列表获取。需注意非官方接口存在稳定性风险,使用时应遵守平台规则,控制请求频率,防范封禁与法律风险。适用于个人学习、演出信息监控等场景。
|
4月前
|
人工智能 自然语言处理 安全
Python构建MCP服务器:从工具封装到AI集成的全流程实践
MCP协议为AI提供标准化工具调用接口,助力模型高效操作现实世界。
784 1
|
4月前
|
JSON API 开发者
深度分析阿里妈妈API接口,用Python脚本实现
阿里妈妈是阿里巴巴旗下营销平台,提供淘宝联盟、直通车等服务,支持推广位管理、商品查询等API功能。本文详解其API调用方法,重点实现商品推广信息(佣金、优惠券)获取,并提供Python实现方案。
|
4月前
|
JSON API 数据安全/隐私保护
深度分析虾皮城API接口,用Python脚本实现
虾皮开放平台提供丰富的API接口,支持商品管理、订单处理及促销信息查询等功能。本文详解API认证机制与调用方法,基于Python实现商品价格及到手价获取方案,适用于电商数据分析与运营。
|
4月前
|
API 数据安全/隐私保护 开发者
深度分析苏宁API接口,用Python脚本实现
深度分析苏宁API接口,用Python脚本实现
|
4月前
|
前端开发 Shell API
深度分析58同城API接口,用Python脚本实现
58同城为国内知名分类信息平台,涵盖房产、招聘、二手车等多领域。本文基于网页抓包与解析,分享其非官方接口的Python实现方案,分析核心接口特性与反爬应对策略,适用于数据学习与信息聚合。注意:非官方接口存在风险,使用需遵守平台规则。
|
3月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
287 102
|
3月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
314 104

推荐镜像

更多