Python基础之文件目录操作

简介: Python基础之文件目录操作

概述

I/O操作不仅包括屏幕输入输出,还包括文件的读取与写入,Python提供了很多必要的方法和功能,进行文件及文件夹的相关操作。本文主要通过两个简单的小例子,简述Python在文件夹及文件的应用,仅供学习分享使用,如有不足之处,还请指正。

涉及知识点

  1. os模块:os 模块提供了非常丰富的方法用来处理文件和目录。
  2. open方法:open方法用于打开一个文件,用于读取和写入。

实例1:获取指定目录下所有的文件大小,并找出最大文件及最小文件

分解步骤:

  1. 遍历文件夹下所有的子文件及子文件夹(需要递归),并计算每一个文件的大小
  2. 计算所有文件的大小总和
  3. 找出最大文件及最小文件

核心代码

定义一个方法get_file_size,获取单个文件的大小,单位有KB和MB两种。关键点如下所示:

  1. os.path.getsize 用于获取指定文件的大小,单位是Byte。
  2. round为四舍五入函数,保留指定位数的小数。
def get_file_size(file_path, KB=False, MB=False):
    """获取文件大小"""
    size = os.path.getsize(file_path)
    if KB:
        size = round(size / 1024, 2)
    elif MB:
        size = round(size / 1024 * 1024, 2)
    else:
        size = size
    return size

定义一个方法list_files,遍历指定文件目录,并存入字典当中。关键点如下所示:

  1. os.path.isfile 用于判断给定的路径是文件还是文件夹。
  2. os.listdir 用于获取指定目录下所有的文件及文件夹,返回一个列表,但是只是当前文件夹的名称,并不是全路径。
  3. os.path.join 用于拼接两个路径
def list_files(root_dir):
    """遍历文件"""
    if os.path.isfile(root_dir):  # 如果是文件
        size = get_file_size(root_dir, KB=True)
        file_dict[root_dir] = size
    else:
        # 如果是文件夹,则遍历
        for f in os.listdir(root_dir):
            # 拼接路径
            file_path = os.path.join(root_dir, f)
            if os.path.isfile(file_path):
                # 如果是一个文件
                size = get_file_size(file_path, KB=True)
                file_dict[file_path] = size
            else:
                list_files(file_path)

计算总大小和最大文件及最小文件,如下所示:

通过比较字典value的大小,返回对应的key的名称。关键点如下所示:

  1. max_file = max(file_dict, key=lambda x: file_dict[x])
  2. min_file = min(file_dict, key=lambda x: file_dict[x])
if __name__ == '__main__':
    list_files(root_dir)
    # print( len(file_dict))
    # 计算文件目录大小
    total_size = 0
    # 遍历字典的key
    for file in file_dict:
        total_size += file_dict[file]
    print('total size is : %.2f' % total_size)
    # 找最大最小文件
    max_file = max(file_dict, key=lambda x: file_dict[x])
    min_file = min(file_dict, key=lambda x: file_dict[x])
    print('max file is : ', max_file, '\n file size is :', file_dict[max_file])
    print('min file is : ', min_file, '\n file size is :', file_dict[min_file])

实例2:将两个文本文件中的内容进行合并,并保存到文件中

两个文件内容,如下图所示:

分解步骤:

  1. 读取两个文件中的内容并进行解析出key和value,存入字典当中(两个字典,分别存储两个文件的内容)。
  2. 遍历第1个字典,并查找第2个字典当中相同key的值,如不存在,则只显示第1个内容,如存在,则进行合并。
  3. 遍历第2个字典,并查找不在第1个字典当中的key的值,进行累加。
  4. 将拼接后的列表存入文件当中。

核心代码

定义一个函数read_book,用于读取两个文件的内容。关键点如下所示:

  1. open函数用于打开一个文件,文件编码为UTF-8。
  2. readlines用于读取所有的行,并返回一个列表。
  3. split用于分割字符串为数组。
def read_book():
    """读取内容"""
    # 读取一个文件
    file1 = open('book1.txt', 'r', encoding='UTF-8')
    lines1 = file1.readlines()
    file1.close()
    for line in lines1:
        line = line.strip()  # 去空白
        content = line.split(',')
        book1[content[0]] = content[1]
    # 另一种方式,读取另一个文件,不需要close,会自动关闭
    with open('book2.txt', 'r', encoding='UTF-8') as file2:
        lines2 = file2.readlines()
    for line in lines2:
        line = line.strip()  # 去空白
        content = line.split(',')
        book2[content[0]] = content[1]

定义一个函数,用于合并内容,并保存。关键点如下所示:

  1. append 用于为数组添加新元素。
  2. dict.keys函数 用于返回所有的key。
  3. join函数用于将数组转换成字符串,并以对应字符分割。
  4. writelines 用于写入所有的行到文件。
  5. with语法,当执行结束时,自动close,并释放资源。
def merge_book():
    """合并内容"""
    lines = []  # 定义一个空列表
    header = '姓名\t 电话\t 文本\n'
    lines.append(header)
    # 遍历第一个字典
    for key in book1:
        line = ''
        if key in book2.keys():
            line = line + '\t'.join([key, book1[key], book2[key]])
            line += '\n'
        else:
            line = line + '\t'.join([key, book1[key], ' *****'])
            line += '\n'
        lines.append(line)
    # 遍历第2个,将不包含在第1个里面的写入
    for key in book2:
        line = ''
        if key not in book1.keys():
            line = line + '\t'.join([key, ' *****', book2[key]])
            line += '\n'
            lines.append(line)
    # 写入book3
    with open('book3.txt', 'w', encoding='UTF-8') as f:
        f.writelines(lines)

整体调用,如下所示:

if __name__ == '__main__':
    # 读取内容
    read_book()
    # 合并内容
    merge_book()
    # print(book1)
    # print(book2)

最后拼接后生成的文件,如下所示:

通过以上两个例子,可以大致了解文件及目录操作的一些方法及步骤。

备注

西江月·夜行黄沙道中

[宋]辛弃疾

明月别枝惊鹊,清风半夜鸣蝉。稻花香里说丰年,听取蛙声一片。

七八个星天外,两三点雨山前。旧时茅店社林边,路转溪桥忽见。

相关文章
|
2月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
2月前
|
编译器 Python
如何利用Python批量重命名文件
本文介绍了如何使用Python和PyCharm对文件进行批量重命名,包括文件名前后互换、按特定字符调整顺序等实用技巧,并提供了完整代码示例。同时推荐了第三方工具Bulk Rename Utility,便于无需编程实现高效重命名。适用于需要处理大量文件命名的场景,提升工作效率。
|
3月前
|
编解码 Prometheus Java
当Python同时操作1000个文件时,为什么你的CPU只用了10%?
本文介绍如何构建一个高效的文件处理系统,解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合,实现任务调度优化,提升I/O密集型操作的性能。
66 4
|
3月前
|
人工智能 索引 Python
[oeasy]python094_使用python控制音符列表_midi_文件制作
本文介绍了如何使用Python控制音符列表制作MIDI文件。首先回顾了列表下标索引(正数和负数)的用法,接着通过`mido`库实现MIDI文件生成。以《两只老虎》为例,详细解析了代码逻辑:定义音高映射、构建旋律列表、创建MIDI文件框架,并将音符插入音轨。还探讨了音符时值与八度扩展的实现方法。最终生成的MIDI文件可通过不同平台播放或编辑。总结中提到,此技术可用于随机生成符合调性的旋律,同时引发对列表其他实际应用的思考。
97 6
|
2月前
|
数据采集 监控 算法
Python文件与目录比较全攻略:从基础操作到性能优化
文件比较的核心在于数据指纹校验,通过逐字节比对生成唯一标识,确保内容一致性。从标准库的os与filecmp到高性能第三方库如pydiffx,再到分布式与量子加密技术的未来趋势,文件比较广泛应用于数据备份、代码审查与系统监控等领域,是保障数据完整性的关键技术手段。
75 0
|
5月前
|
Python
使用Python实现multipart/form-data文件接收的http服务器
至此,使用Python实现一个可以接收 'multipart/form-data' 文件的HTTP服务器的步骤就讲解完毕了。希望通过我的讲解,你可以更好地理解其中的逻辑,另外,你也可以尝试在实际项目中运用这方面的知识。
252 69
|
3月前
|
数据采集 存储 API
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件
|
3月前
|
数据采集 运维 BI
Python 文件操作进阶|使用 shutil 实现高效文件复制
在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!
|
5月前
|
Shell 开发者 Docker
Python文件打包:一站式指南
本文深入探讨Python文件打包的各种方法,从基础的zip和tar工具到高级的setuptools、PyInstaller、cx_Freeze等,涵盖Docker镜像、虚拟环境及自包含可执行文件的打包方式。通过示例代码与详细解析,帮助开发者根据项目需求选择合适的打包方案,提升代码分发与部署效率。内容全面,适合各水平读者学习参考。
418 7
|
6月前
|
存储 算法 文件存储
探秘文件共享服务之哈希表助力 Python 算法实现
在数字化时代,文件共享服务不可或缺。哈希表(散列表)通过键值对存储数据,利用哈希函数将键映射到特定位置,极大提升文件上传、下载和搜索效率。例如,在大型文件共享平台中,文件名等信息作为键,物理地址作为值存入哈希表,用户检索时快速定位文件,减少遍历时间。此外,哈希表还用于文件一致性校验,确保传输文件未被篡改。以Python代码示例展示基于哈希表的文件索引实现,模拟文件共享服务的文件索引构建与检索功能。哈希表及其分布式变体如一致性哈希算法,保障文件均匀分布和负载均衡,持续优化文件共享服务性能。

热门文章

最新文章

推荐镜像

更多