Python基础之文件目录操作

简介: Python基础之文件目录操作

概述

I/O操作不仅包括屏幕输入输出,还包括文件的读取与写入,Python提供了很多必要的方法和功能,进行文件及文件夹的相关操作。本文主要通过两个简单的小例子,简述Python在文件夹及文件的应用,仅供学习分享使用,如有不足之处,还请指正。

涉及知识点

  1. os模块:os 模块提供了非常丰富的方法用来处理文件和目录。
  2. open方法:open方法用于打开一个文件,用于读取和写入。

实例1:获取指定目录下所有的文件大小,并找出最大文件及最小文件

分解步骤:

  1. 遍历文件夹下所有的子文件及子文件夹(需要递归),并计算每一个文件的大小
  2. 计算所有文件的大小总和
  3. 找出最大文件及最小文件

核心代码

定义一个方法get_file_size,获取单个文件的大小,单位有KB和MB两种。关键点如下所示:

  1. os.path.getsize 用于获取指定文件的大小,单位是Byte。
  2. round为四舍五入函数,保留指定位数的小数。
def get_file_size(file_path, KB=False, MB=False):
    """获取文件大小"""
    size = os.path.getsize(file_path)
    if KB:
        size = round(size / 1024, 2)
    elif MB:
        size = round(size / 1024 * 1024, 2)
    else:
        size = size
    return size

定义一个方法list_files,遍历指定文件目录,并存入字典当中。关键点如下所示:

  1. os.path.isfile 用于判断给定的路径是文件还是文件夹。
  2. os.listdir 用于获取指定目录下所有的文件及文件夹,返回一个列表,但是只是当前文件夹的名称,并不是全路径。
  3. os.path.join 用于拼接两个路径
def list_files(root_dir):
    """遍历文件"""
    if os.path.isfile(root_dir):  # 如果是文件
        size = get_file_size(root_dir, KB=True)
        file_dict[root_dir] = size
    else:
        # 如果是文件夹,则遍历
        for f in os.listdir(root_dir):
            # 拼接路径
            file_path = os.path.join(root_dir, f)
            if os.path.isfile(file_path):
                # 如果是一个文件
                size = get_file_size(file_path, KB=True)
                file_dict[file_path] = size
            else:
                list_files(file_path)

计算总大小和最大文件及最小文件,如下所示:

通过比较字典value的大小,返回对应的key的名称。关键点如下所示:

  1. max_file = max(file_dict, key=lambda x: file_dict[x])
  2. min_file = min(file_dict, key=lambda x: file_dict[x])
if __name__ == '__main__':
    list_files(root_dir)
    # print( len(file_dict))
    # 计算文件目录大小
    total_size = 0
    # 遍历字典的key
    for file in file_dict:
        total_size += file_dict[file]
    print('total size is : %.2f' % total_size)
    # 找最大最小文件
    max_file = max(file_dict, key=lambda x: file_dict[x])
    min_file = min(file_dict, key=lambda x: file_dict[x])
    print('max file is : ', max_file, '\n file size is :', file_dict[max_file])
    print('min file is : ', min_file, '\n file size is :', file_dict[min_file])

实例2:将两个文本文件中的内容进行合并,并保存到文件中

两个文件内容,如下图所示:

分解步骤:

  1. 读取两个文件中的内容并进行解析出key和value,存入字典当中(两个字典,分别存储两个文件的内容)。
  2. 遍历第1个字典,并查找第2个字典当中相同key的值,如不存在,则只显示第1个内容,如存在,则进行合并。
  3. 遍历第2个字典,并查找不在第1个字典当中的key的值,进行累加。
  4. 将拼接后的列表存入文件当中。

核心代码

定义一个函数read_book,用于读取两个文件的内容。关键点如下所示:

  1. open函数用于打开一个文件,文件编码为UTF-8。
  2. readlines用于读取所有的行,并返回一个列表。
  3. split用于分割字符串为数组。
def read_book():
    """读取内容"""
    # 读取一个文件
    file1 = open('book1.txt', 'r', encoding='UTF-8')
    lines1 = file1.readlines()
    file1.close()
    for line in lines1:
        line = line.strip()  # 去空白
        content = line.split(',')
        book1[content[0]] = content[1]
    # 另一种方式,读取另一个文件,不需要close,会自动关闭
    with open('book2.txt', 'r', encoding='UTF-8') as file2:
        lines2 = file2.readlines()
    for line in lines2:
        line = line.strip()  # 去空白
        content = line.split(',')
        book2[content[0]] = content[1]

定义一个函数,用于合并内容,并保存。关键点如下所示:

  1. append 用于为数组添加新元素。
  2. dict.keys函数 用于返回所有的key。
  3. join函数用于将数组转换成字符串,并以对应字符分割。
  4. writelines 用于写入所有的行到文件。
  5. with语法,当执行结束时,自动close,并释放资源。
def merge_book():
    """合并内容"""
    lines = []  # 定义一个空列表
    header = '姓名\t 电话\t 文本\n'
    lines.append(header)
    # 遍历第一个字典
    for key in book1:
        line = ''
        if key in book2.keys():
            line = line + '\t'.join([key, book1[key], book2[key]])
            line += '\n'
        else:
            line = line + '\t'.join([key, book1[key], ' *****'])
            line += '\n'
        lines.append(line)
    # 遍历第2个,将不包含在第1个里面的写入
    for key in book2:
        line = ''
        if key not in book1.keys():
            line = line + '\t'.join([key, ' *****', book2[key]])
            line += '\n'
            lines.append(line)
    # 写入book3
    with open('book3.txt', 'w', encoding='UTF-8') as f:
        f.writelines(lines)

整体调用,如下所示:

if __name__ == '__main__':
    # 读取内容
    read_book()
    # 合并内容
    merge_book()
    # print(book1)
    # print(book2)

最后拼接后生成的文件,如下所示:

通过以上两个例子,可以大致了解文件及目录操作的一些方法及步骤。

备注

西江月·夜行黄沙道中

[宋]辛弃疾

明月别枝惊鹊,清风半夜鸣蝉。稻花香里说丰年,听取蛙声一片。

七八个星天外,两三点雨山前。旧时茅店社林边,路转溪桥忽见。

相关文章
|
10天前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
28天前
|
测试技术 Python
【03】做一个精美的打飞机小游戏,规划游戏项目目录-分门别类所有的资源-库-类-逻辑-打包为可玩的exe-练习python打包为可执行exe-优雅草卓伊凡-持续更新-分享源代码和游戏包供游玩-1.0.2版本
【03】做一个精美的打飞机小游戏,规划游戏项目目录-分门别类所有的资源-库-类-逻辑-打包为可玩的exe-练习python打包为可执行exe-优雅草卓伊凡-持续更新-分享源代码和游戏包供游玩-1.0.2版本
103 31
【03】做一个精美的打飞机小游戏,规划游戏项目目录-分门别类所有的资源-库-类-逻辑-打包为可玩的exe-练习python打包为可执行exe-优雅草卓伊凡-持续更新-分享源代码和游戏包供游玩-1.0.2版本
|
21天前
|
监控 网络安全 开发者
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
50 20
|
26天前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
|
27天前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
1月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
2月前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
74 7
|
3月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
173 2
|
3月前
|
中间件 Docker Python
【Azure Function】FTP上传了Python Function文件后,无法在门户页面加载函数的问题
通过FTP上传Python Function至Azure云后,出现函数列表无法加载的问题。经排查,发现是由于`requirements.txt`中的依赖包未被正确安装。解决方法为:在本地安装依赖包到`.python_packages/lib/site-packages`目录,再将该目录内容上传至云上的`wwwroot`目录,并重启应用。最终成功加载函数列表。
|
4月前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。

热门文章

最新文章