python文件的打开、读取、关闭、写入与二进制文件的读写操作

简介: python文件的打开、读取、关闭、写入与二进制文件的读写操作

1.文件的打开

1.1 open()函数

文件(file)也通过Python程序来对计算机中的各种文件进行增删改查 的操作 。
文件的操作步骤:

  • 打开文件
  • 对文件进行各种操作(读、写)然后保存
  • 关闭文件

示例
先创建我们要运行的py文件,在当前文件所在目录创建一个名为demo的文本文件(txt文档格式)。
然后在其中手动写入以下字符内容并保存

123456
abcdef
01010101

再在原py文件中写入以下代码:

# python 操作数据都是要通过操作这个数据创建的变量才可以实施
file_name = 'demo.txt'  # 绝对路径
file_obj = open(file_name)  # 打开的文件对象
print(file_obj)

如果不懂路径相关的,open()函数因为找不到文件而报错,也可以直接把file_name变量名定义成 "路径+demo.txt"的格式。这样无论demo.txt文件放在哪里都是可以找到的。

如图,open(file_name)成功创建出了一个对象。
在这里插入图片描述
可以将文件分为2种类型,

  • 一种是纯文本文件(使用utf-8编码编写的文件)。
  • 一种是二进制文件(图片 mp3 视频…)

open()打开文件时,默认是以文本文件的形式打开的,open()默认的编码为None,所以处理文本文件时要指定编码。这一环节在下边的读取部分中再体现。


1.2 with open(xxx) as xx: 语句

也可以用with open(xxx) as xx: 语句来代替直接进行对open()函数的调用。

file_name = 'demo.txt'

try:
    with open(file_name, encoding='utf-8') as f:  # 对于我们打开的这个文件对象取名为f
        file_obj = open(file_name)  # 打开的文件对象
        print(file_obj)
    
except FileNotFoundError:
    print('文件名没有找到')

2. 文件的读取

2.1 read()函数

通过read()函数读取文件内容时会将文件中所有的内容全部读取出来。。

file_name = 'demo.txt'
file_obj = open(file_name)  # 打开的文件对象
content = file_obj.read()

输出结果如下:
在这里插入图片描述
demo.txt文档被打印出了。

如要查看read()函数说明的文本字符串:

help(file_obj.read)   # 可以以这样的形式来查看read()函数的用法详情

结果如下:
在这里插入图片描述


2.2 读取中文 encoding参数

如果demo.txt文本文件中有中文,(比如现在我们在其中再写入一行“云雀叫了一整天”七个字。)
再运行上述代码则会报错:
在这里插入图片描述

我们需要在open()函数中加入参数encoding=‘utf-8’,才可读取。

  • (基础补充:Unicode及万国码 包含世界上所有语言和字符,编写程序一般都会使用Unicode编码。Unicode编码有多种实现: UTF-8 UTF-16 UTF-32。其中UTF-8支持的字符是最多的。UTF-16少一半,UTF-32又少一半。支持字符越多适用范围越广,支持字符越少越简洁高效。我们一般使用utf-8较多)
file_name = 'demo.txt'
file_obj = open(file_name, encoding='utf-8')  # 打开的文件对象
content = file_obj.read()

结果正常打印出了:
在这里插入图片描述


2.3 较大文件的读取 readline()与readlines()

read()可以接收一个size作为参数,改参数用来指定读取字符的数量,默认为-1,表示读取全部内容。

file_name = 'demo.txt'
file_obj = open(file_name, encoding='utf-8')  # 打开的文件对象
content = file_obj.read(25) # 读取25个字符
print(content)

结果:
在这里插入图片描述

如果读取的文件比较大的话,会一次性地讲文件加载到内容中。容易导致内存泄露。所有对于较大的文件通常不用read()函数读取。
readline()用于一行一行地读取,
readlines()用于一行一行地读取,一次性将读取到的内容封装到一个列表中返回。

file_name = 'demo.txt'

try:
    with open(file_name, encoding='utf-8') as f:  # 对于我们打开的这个文件对象取名为f
        # content = f.read(4)  # 给size传递参数,一次读取多少个字节
        # content = f.readline()  # 一行一行的读取,不再示例。
        content = f.readlines()  # 也是一行一行的读取,不过会读取完所有,并且存放到列表中
        print(content)
except FileNotFoundError:
    print('文件名没有找到')

输出结果:
在这里插入图片描述


3. 文件的关闭

  • 调用close()方法来关闭文件
  • with … as …语句自带关闭,不需要写close()。
    示例如下:
file_name = 'demo.txt'
file_obj = open(file_name, encoding='utf-8')   # 打开的文件对象
content = file_obj.read() # 文件读取
print(content)
file_obj.close()  # 关闭文件之后就不能再继续读取了
con = file_obj.read()  # 文件读取
print(con)

在这里插入图片描述


4. 文件的写入

write()用来向文件中写入内容

  • 该方法可以分多次向文件中写入内容
  • 写入完成后该方法会返回写入字符的个数

使用open()函数打开问件的时候,必须指定打开文件要做的操作(读,写,追加)。默认为只读。
具体如下:
在这里插入图片描述
常用的有

  • 只读:r,也是默认的。
  • w可写,是覆盖写入,会清除原有的内容。如果文件不存在则会创建一个文件。
  • a 追加写入,即在原文本后边append新内容,不覆盖。
    代码示例:
file_name = 'demo.txt'

file_obj = open(file_name, encoding='utf-8')
content = file_obj.read()
print(content)  # 输出原文本
file_obj.close()

try:
    with open(file_name, 'a', encoding='utf-8') as f:  # 对于我们打开的这个文件对象取名为f
        f.write('\n1433223')   #换行写入,其中\n表示换行
except FileNotFoundError:
    print('文件名没有找到')

file_obj = open(file_name, encoding='utf-8')
content = file_obj.read()
print(content)  # 输出追加写入后的文本
file_obj.close()

运行结果:
在这里插入图片描述


5. 二进制文件的读写操作

读取文本文件时,size是以字符为单位。而读取二进制文件时,size是以字节为单位。
同样还是使用 open()函数 或者 with open(xxx) as xx: 语句 ,只不过,我们在传入模式参数时,需要在后边加上一个’b’表示二进制文件(binary)。
如wb表示覆盖写入二进制文件,rb表示读取二进制文件,ab表示追加写入二进制文件。其它同文本文件的读写操作。
一个实例:

# 首先我们要准备两个mp3文件,如我选择歌曲 我的战争(巨人片头曲) 和 Tassel。
file_name = r'我的战争.mp3'  
# 前边加r表示是告诉解释器所有字符按照原本的样子进行解释,即不存在转义字符。当此字符串包含文件路径时,作用就显而易见了。

# 将读取出来的二进制文件内容续写成一个新的二进制文件
with open(file_name, 'rb') as f:  # 只读模式打开“我的战争.mp3”
    # print(f)
    new_file = 'Tassel.mp3'
    with open(new_file, 'ab') as file:  # 追加写入模式 打开"Tessel.mp3"
        while True:
            content = f.read()   # 读取“我的战争.mp3”
            if not content:  # 当content为None的时候
                break
            file.write(content)  # 将我的战争的二进制序列写在Tassel后边

运行后我们可以发现,再去听原Tassel.mp3文件的时候,我们战争.mp3也被拼接在了后边,歌曲长度变长了。
这里的read()函数,里边的size参数的数值表示字节,# 如read(1024*10),1024表示byte为1kb,后边乘以多少就表示读取 我的战争 多少kb。


本次分享就到这里,祝您学习顺利!

目录
相关文章
|
7月前
|
数据可视化 Linux iOS开发
Python脚本转EXE文件实战指南:从原理到操作全解析
本教程详解如何将Python脚本打包为EXE文件,涵盖PyInstaller、auto-py-to-exe和cx_Freeze三种工具,包含实战案例与常见问题解决方案,助你轻松发布独立运行的Python程序。
1792 2
|
6月前
|
监控 机器人 编译器
如何将python代码打包成exe文件---PyInstaller打包之神
PyInstaller可将Python程序打包为独立可执行文件,无需用户安装Python环境。它自动分析代码依赖,整合解释器、库及资源,支持一键生成exe,方便分发。使用pip安装后,通过简单命令即可完成打包,适合各类项目部署。
1214 68
|
9月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
9月前
|
编译器 Python
如何利用Python批量重命名文件
本文介绍了如何使用Python和PyCharm对文件进行批量重命名,包括文件名前后互换、按特定字符调整顺序等实用技巧,并提供了完整代码示例。同时推荐了第三方工具Bulk Rename Utility,便于无需编程实现高效重命名。适用于需要处理大量文件命名的场景,提升工作效率。
|
8月前
|
缓存 数据可视化 Linux
Python文件/目录比较实战:排除特定类型的实用技巧
本文通过四个实战案例,详解如何使用Python比较目录差异并灵活排除特定文件,涵盖基础比较、大文件处理、跨平台适配与可视化报告生成,助力开发者高效完成目录同步与数据校验任务。
283 0
|
10月前
|
编解码 Prometheus Java
当Python同时操作1000个文件时,为什么你的CPU只用了10%?
本文介绍如何构建一个高效的文件处理系统,解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合,实现任务调度优化,提升I/O密集型操作的性能。
244 4
|
9月前
|
安全 Linux 网络安全
Python极速搭建局域网文件共享服务器:一行命令实现HTTPS安全传输
本文介绍如何利用Python的http.server模块,通过一行命令快速搭建支持HTTPS的安全文件下载服务器,无需第三方工具,3分钟部署,保障局域网文件共享的隐私与安全。
2371 0
|
9月前
|
数据管理 开发工具 索引
在Python中借助Everything工具实现高效文件搜索的方法
使用上述方法,你就能在Python中利用Everything的强大搜索能力实现快速的文件搜索,这对于需要在大量文件中进行快速查找的场景尤其有用。此外,利用Python脚本可以灵活地将这一功能集成到更复杂的应用程序中,增强了自动化处理和数据管理的能力。
769 0
|
9月前
|
数据采集 监控 算法
Python文件与目录比较全攻略:从基础操作到性能优化
文件比较的核心在于数据指纹校验,通过逐字节比对生成唯一标识,确保内容一致性。从标准库的os与filecmp到高性能第三方库如pydiffx,再到分布式与量子加密技术的未来趋势,文件比较广泛应用于数据备份、代码审查与系统监控等领域,是保障数据完整性的关键技术手段。
202 0
|
10月前
|
数据采集 存储 API
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件