图解python | 文件读写

简介: 读写文件是最常见的操作之一,Python内置了open()函数,用于对文件进行读写操作。每当我们用open方法打开一个文件时,将返回一个文件对象。

ShowMeAI研究中心

作者:韩信子@ShowMeAI
教程地址http://www.showmeai.tech/tutorials/56
本文地址http://www.showmeai.tech/article-detail/85
声明:版权所有,转载请联系平台与作者并注明出处


1.python文件读写

读写文件是最常见的操作之一,Python内置了读写文件的函数,整体是比较方便的。

在磁盘上读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

Python文件读写知识地图@ShowMeAI

2.open方法

Python内置了open()函数,用于对文件进行读写操作。使用open()方法操作文件就像把大象塞进冰箱一样,可以分3步走,一是打开文件,二是操作文件,三是关闭文件。

open()方法的返回值是一个file对象,可以将它赋值给一个变量(文件句柄)。基本语法格式为:

f = open(filename, mode)

PS:Python中,所有具有read和write方法的对象,都可以归类为file类型。而所有的file类型对象都可以使用open方法打开,close方法结束和被with上下文管理器管理。这是Python的设计哲学之一。

filename:一个包含了你要访问的文件名称的字符串值,通常是一个文件路径。

mode:打开文件的模式,有很多种,默认是只读方式r。

一个简单的例子:

# 打开一个文件
f = open("/tmp/foo.txt", "w")
f.write("Python 是一种非常好的语言。\n我喜欢Python!!\n")
# 关闭打开的文件
f.close()

(1)打开模式:

模式 操作 说明
r 只读 默认模式,如果文件不存在就报错,存在就正常读取。
w 只写 如果文件不存在,新建文件然后写入;如果存在,先清空文件内容,再写入。
a 追加 如果文件不存在,新建文件,然后写入;如果存在,在文件的最后追加写入。
x 新建 如果文件存在则报错,如果不存在就新建文件,然后写入内容,比w模式更安全。
b 二进制模式 比如rb、wb、ab,以bytes类型操作数据
+ 读写模式 比如r+、w+、a+

(2)b模式

二进制模式,通常用来读取图片、视频等二进制文件。注意,它在读写的时候是以bytes类型读写的,因此获得的是一个bytes对象而不是字符串。在这个读写过程中,需要自己指定编码格式。在使用带b的模式时一定要注意传入的数据类型,确保为bytes类型。

(可以在在线python3环境中运行代码学习):

s = 'ShowMeAI是数据科学与人工智能领域的资料库和学习社区'
b = bytes(s,encoding='utf-8')

f = open('test.txt','w')
f.write(s)

#这样没问题,正常写入了文件。

#-------------------------------------------------
s = "ShowMeAI是数据科学与人工智能领域的资料库和学习社区。\n我喜欢ShowMeAI!!\n"
b = bytes(s,encoding='utf-8')

f = open('test_b.txt','wb')    #注意多了个b
f.write(s)

#报错
TypeError: a bytes-like object is required, not 'str'
#意思是它需要一个bytes类型数据,你却给了个字符串

#---------------------------------------------------
s = "ShowMeAI是数据科学与人工智能领域的资料库和学习社区。\n我喜欢ShowMeAI!!\n"
b = bytes(s,encoding='utf-8')

f = open('test_b.txt','wb')    # 注意多了个b
f.write(b)                        # 将变量b传给它,b是个bytes类型

(3)+模式

对于w+模式,在读写之前都会清空文件的内容,建议不要使用!

对于a+模式,永远只能在文件的末尾写入,有局限性,建议不要使用!

对于r+模式,也就是读写模式,配合seek()和tell()方法,可以实现更多操作。

3.文件编码

要读取非UTF-8编码的文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:

>>> f = open('gbk.txt', 'r', encoding='gbk')
>>> f.read()
'GBK'

遇到有些编码不规范的文件,可能会抛出UnicodeDecodeError异常,这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况,可以提供errors参数,表示如果遇到编码错误后如何处理。

>>> f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')

4.文件对象操作

每当我们用open方法打开一个文件时,将返回一个文件对象。这个对象内置了很多操作方法。下面假设,已经打开了一个f文件对象。

(1)read函数

读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数,用于指定读取的数据量。当size被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

f = open("test.txt", "r")

str = f.read()
print(str)

f.close()

如果文件体积较大,请不要使用read()方法一次性读入内存,而是read(512)这种一点一点的读。

(2)readline函数

从文件中读取一行n内容。换行符为'\n'。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行,并且不能回头,只能前进,读过的行不能再读了。

f = open("test.txt", "r")
str = f.readline()
print(str)
f.close()

(3)readlines函数

将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines方法会一次性将文件全部读入内存,所以也存在一定的风险。但是它有个好处,每行都保存在列表里,可以随意存取。

f = open("test.txt", "r")
a = f.readlines()
print(a)
f.close()

(4)遍历文件

实际上,更多的时候,我们将文件对象作为一个迭代器来使用。

# 打开一个文件
f = open("test.txt", "r")

for line in f:
    print(line, end='')

# 关闭打开的文件
f.close()

这个方法很简单, 不需要将文件一次性读出,但是同样没有提供一个很好的控制,与readline方法一样只能前进,不能回退。

几种不同的读取和遍历文件的方法比较:

  • 如果文件很小,read()一次性读取最方便。
  • 如果不能确定文件大小,反复调用read(size)比较保险。
  • 如果是配置文件,调用readlines()最方便。
  • 普通情况,使用for循环更好,速度更快。

(5)write函数

将字符串或bytes类型的数据写入文件内。write()动作可以多次重复进行,其实都是在内存中的操作,并不会立刻写回硬盘,直到执行close()方法后,才会将所有的写入操作反映到硬盘上。在这过程中,如果想将内存中的修改,立刻保存到硬盘上,可以使用f.flush()方法,但这可能造成数据的不一致。

# 打开一个文件
f = open("/tmp/foo.txt", "w")

f.write("ShowMeAI是数据科学与人工智能领域的资料库和学习社区。\n我喜欢ShowMeAI!!\n")

# 关闭打开的文件
f.close()

(6)tell函数

返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了,是字节数,不是字符数。

(7)seek函数

如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what的值,如果是0表示从文件开头计算,如果是1表示从文件读写指针的当前位置开始计算,2表示从文件的结尾开始计算,默认为0,例如:

offset:表示偏移量。

  • seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
  • seek(x,1) : 表示从当前位置往后移动x个字符
  • seek(-x,2):表示从文件的结尾往前移动x个字符

参考下述代码示例

>>> f = open("test.txt", "rb+")
>>> f.write(b"ShowMeAI is born for AI and data science.\nI love ShowMeAI!!\n")
60
>>> f.tell()
60
>>> f.seek(5)
5
>>> f.read(6)
b'eAI is'
>>> f.seek(-3, 2)
92
>>> f.read(2)
b'!!'

(8)close函数

关闭文件对象。当处理完一个文件后,调用f.close()来关闭文件并释放系统的资源。文件关闭后,如果尝试再次调用该文件对象,则会抛出异常。如果忘记调用close(),可能会导致只写了一部分数据到磁盘而丢失其他的内容。也就是说「大象塞进冰箱后,一定不要忘记关上冰箱的门」。

5.with关键字

with关键字用于Python的上下文管理器机制。为了防止诸如open这一类文件打开方法在操作过程出现异常或错误,或者最后忘了执行close方法,文件非正常关闭等可能导致文件泄露、破坏的问题。Python提供了with这个上下文管理器机制,保证文件会被正常关闭。在它的管理下,不需要再写close语句。注意缩进。

with open('test.txt', 'w') as f:
    f.write('Hello, ShowMeAI!')

with支持同时打开多个文件:

with open('log1') as obj1, open('log2','w') as obj2:
    s=obj1.read()
    obj2.write(s)

6.视频教程

也可以点击 这里 到B站查看有【中英字幕】的版本

[video(video-93P0IV3T-1645638141450)(type-bilibili)(url-https://player.bilibili.com/player.html?aid=505628451&page=23)(image-https://img-blog.csdnimg.cn/img_convert/0cee004b37fe825f7e7b349b8da93dfb.png)(title-【双语字幕+资料下载】Python 3全系列基础教程,全程代码演示&讲解!10小时视频42节,保证你能掌握Python!快来一起跟着视频敲代码~<快速入门系列>)]

[video(video-EJKCMlAH-1645638150855)(type-bilibili)(url-https://player.bilibili.com/player.html?aid=505628451&page=24)(image-https://img-blog.csdnimg.cn/img_convert/a1b9c6352a41d579404af413dfb07b14.png)(title-【双语字幕+资料下载】Python 3全系列基础教程,全程代码演示&讲解!10小时视频42节,保证你能掌握Python!快来一起跟着视频敲代码~<快速入门系列>)]


资料与代码下载

本教程系列的代码可以在ShowMeAI对应的github中下载,可本地python环境运行,能访问Google的宝宝也可以直接借助google colab一键运行与交互操作学习哦!

本教程系列涉及的Python速查表可以在以下地址下载获取:

拓展参考资料

ShowMeAI相关文章推荐

ShowMeAI系列教程推荐

showmeai

目录
相关文章
|
1月前
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
313 60
|
1月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
13天前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
16 2
|
1月前
|
Linux 区块链 Python
Python实用记录(十三):python脚本打包exe文件并运行
这篇文章介绍了如何使用PyInstaller将Python脚本打包成可执行文件(exe),并提供了详细的步骤和注意事项。
51 1
Python实用记录(十三):python脚本打包exe文件并运行
|
26天前
|
Python
python读写操作excel日志
主要是读写操作,创建表格
54 2
|
29天前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
30天前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
1月前
|
JSON 数据格式 Python
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
这篇文章介绍了一个Python脚本,用于统计TXT或JSON文件中特定单词的出现次数。它包含两个函数,分别处理文本和JSON文件,并通过命令行参数接收文件路径、目标单词和文件格式。文章还提供了代码逻辑的解释和示例用法。
42 0
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
|
1月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
|
1月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件