【python基础知识】16.文件读写基础及操作

简介: 【python基础知识】16.文件读写基础及操作

前言


文件读写,是Python代码调用电脑文件的主要功能,能被用于读取和写入文本记录、音频片段、Excel文档、保存邮件以及任何保存在电脑上的东西。

你可能会疑惑:为什么要在Python打开文件?我直接打开那个文件,在那个文件上操作不就好了吗?

一般来说直接打开操作当然是没问题的。但假如你有一项工作,需要把100个Word文档里的资料合并到1个文件上,一个个地复制粘贴多麻烦啊,这时你就能用上Python了。或者,当你要从网上下载几千条数据时,直接用Python帮你把数据一次性存入文件也是相当方便。

要不然怎么说,Python把我们从重复性工作中解放出来呢~

【文件读写】,是分为【读】和【写】两部分的,我们就先来瞧瞧【读文件】是怎么实现的?

读取文件

1.png

其实,真的就三步:

2.png

是不是像很久之前的那个冷笑话?“请问把大象放进冰箱需要几步?”三步:打开冰箱,放入大象,关闭冰箱。同样地,读文件也是三步:开——读——关。

我举个例子好了,你可以跟着我在自己的电脑上操作,如果你的电脑上还没有安装Python环境,可以先安装一下。

首先,我们先在桌面新建一个test文件夹,然后在文件夹里新建一个名为abc的txt文件,在里面随便写点儿什么,我写的是周芷若、赵敏。

我用编辑器Visual Studio Code打开这个文件,是这样的:

3.png然后,你可以用VS Code新建一个open.py的Python文件,也放在test文件夹里,我们就在这里写代码。


代码怎么写呢?


【第1步-开】


使用open()函数打开文件。语法是这样的:

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')

file1这个变量是存放读取的文件数据的,以便对文件进行下一步的操作。


open()函数里面有三个参数,对吧:

'/Users/Ted/Desktop/test/abc.txt'
'r'
encoding='utf-8'

我们一个个来看。第一个参数是文件的保存地址,一定要写清楚,否则计算机找不到。注意:我和你的文件地址是不一样的哦。

要找到你的文件地址,只需要把你要打开的文件直接拖到编辑器终端的窗口里,就会显示出文件地址,然后复制一下就好。

不过文件的地址有两种:相对路径和绝对路径,拖到终端获取的地址是绝对路径。这两种地址,Mac和Windows电脑还有点傲娇地不太一样,下面我就帮大家捋一捋。

绝对路径就是最完整的路径,相对路径指的就是【相对于当前文件夹】的路径,也就是你编写的这个py文件所放的文件夹路径!

如果你要打开的文件和open.py在同一个文件夹里,这时只要使用相对路径就行了,而要使用其他文件夹的文件则需使用绝对路径。

我们先来看Mac电脑,现在我的txt文件和py文件都放在桌面的test文件夹里。

4.png

我将txt文件拖入终端窗口,获得文件的绝对路径:5.png6.png

那么当我用open()函数打开的时候,就可以写成:

open('/Users/Ted/Desktop/test/abc.txt')   #绝对路径
open('abc.txt')    #相对路径
#相对路径也可以写成open('./abc.txt')

在这种情况下,你写绝对和相对路径都是可以的。


假如现在这个txt文件,是放在test文件夹下面一个叫做word的文件夹里,绝对路径和相对路径就变成:

open('/Users/Ted/Desktop/test/word/abc.txt'')
open('word/abc.txt')

我们再来看看Windows。Windows系统里,常用\来表示绝对路径,/来表示相对路径,所以当你把文件拖入终端的时候,绝对路径就变成:

C:\Users\Ted\Desktop\test\abc.txt

但是呢,别忘了\在Python中是转义字符,所以时常会有冲突。为了避坑,Windows的绝对路径通常要稍作处理,写成以下两种格式;

open('C:\\Users\\Ted\\Desktop\\test\\abc.txt')
#将'\'替换成'\\'
open(r'C:\Users\Ted\Desktop\test\abc.txt')
#在路径前加上字母r

获取文件的相对路径还有个小窍门,用VS Code打开文件夹,在文件点击右键,选择:

7.png

现在,把这行代码复制到你的open.py文件中,然后把文件地址替换成你自己的地址。

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')

好了。终于讲完了第一个参数文件地址,我们来回头看看open()的其他参数:

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')

第二个参数表示打开文件时的模式。这里是字符串 ‘r’,表示 read,表示我们以读的模式打开了这个文件。

你可能会疑惑,为什么打开的时候就要决定是读还是写,之后决定不行吗?这是因为,计算机非常注意数据的保密性,在打开时就要决定以什么模式打开文件。

除了’r’,其他还有’w’(写入),‘a’(追加)等模式,我们稍后会涉及到。

第三个参数encoding=‘utf-8’,表示的是返回的数据采用何种编码,一般采用utf-8或者gbk。注意这里是写encoding而不是encode噢。

读文件的三步:开——读——关,【第1步-开】我们就讲完了,现在看【第2步-读】。

【第2步-读】


打开文件file1之后,就可以用read()函数进行读取的操作了。请看代码:

file1 = open('/Users/Ted/Desktop/test/abc.txt', 'r',encoding='utf-8') 
filecontent = file1.read()

第1行代码是我们之前写的。是以读取的方式打开了文件“abc.txt”。

第2行代码就是在读取file1的内容,写法是变量file1后面加个.句点,再加个read(),并且把读到的内容放在变量filecontent里面,这样我们才能拿到文件的内容。

那么,现在我们想要看看读到了什么数据,可以用print()函数看看。请你在自己的电脑里,把剩下的代码补全,可参考下面的代码

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8') 
filecontent = file1.read()   
print(filecontent)

然后,在编辑器窗口【右键】,选择【在终端中运行Python文件】,这时终端显示的是:

8.png

你会发现,打印出了abc.txt文件里面的内容,它会读成字符串的数据形式。


【第3步-关】


关闭文件,使用的是close()函数。

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8') 
filecontent = file1.read()            
print(filecontent)
file1.close()    

前3行代码你都学了,第4行:变量file1后面加个点,然后再加个close(),就代表着关闭文件。千万要记得后面的括号可不能丢。

为啥要关闭文件呢?原因有两个:1.计算机能够打开的文件数量是有限制的,open()过多而不close()的话,就不能再打开文件了。2.能保证写入的内容已经在文件里被保存好了。

文件关闭之后就不能再对这个文件进行读写了。如果还需要读写这个文件的话,就要再次 open() 打开这个文件。

我们总结一下读文件的三步:开——读——关,并奉上一张总结图。

9.png

尤其需要留意的是第二、三步,即读和关的写法。


学完了【读文件】,然后是【写文件】。


写入文件

10.png

嘻嘻,写文件也是三步:打开文件——写入文件——关闭文件。11.png

【第1步-开】


以写入的模式打开文件。

file1 = open('/Users/Ted/Desktop/test/abc.txt','w',encoding='utf-8')

第1行代码:以写入的模式打开了文件"abc.txt"。


open() 中还是三个参数,其他都一样,除了要把第二个参数改成’w’,表示write,即以写入的模式打开文件。


【第2步-写】


往文件中写入内容,使用write()函数。

file1 = open('/Users/Ted/Desktop/test/abc.txt', 'w',encoding='utf-8')
file1.write('张无忌\n')     
file1.write('宋青书\n')  

第2-3行代码:往“abc.txt”文件中写入了“张无忌”和“宋青书”这两个字符串。\n表示另起一行。


请你原样照做,然后记得运行程序。然后当你打开txt文件查看数据:

12.png

诶?原来文件里的周芷若和赵敏去哪里了?


是这样子的,'w’写入模式会给你暴力清空掉文件,然后再给你写入。如果你只想增加东西,而不想完全覆盖掉原文件的话,就要使用’a’模式,表示append,你学过,它是追加的意思。


如果重新再来一遍的话,就要这样写:

file1 = open('/Users/Ted/Desktop/test/abc.txt', 'a',encoding='utf-8') 
#以追加的方式打开文件abc.txt
file1.write('张无忌\n')     
#把字符串'张无忌'写入文件file1
file1.write('宋青书\n')     
#把字符串'宋青书'写入文件file1

这样的话,就会追加成功,而不会覆盖了。你可以随便试试加点什么,运行看看。

13.png

【第3步-关】


还是要记得关闭文件,使用close()函数,看代码:

file1 = open('/Users/Ted/Desktop/test/abc.txt','a',encoding='utf-8') 
file1.write('张无忌\n')     
file1.write('宋青书\n')     
file1.close() 

第4行代码,还是熟悉的配方,还是熟悉的味道。这样就搞定【写文件】了。

不过呢,有两个小提示:1.write()函数写入文本文件的也是字符串类型。2.在’w’和’a’模式下,如果你打开的文件不存在,那么open()函数会自动帮你创建一个。

【练习时间来咯】


1.请你在一个叫1.txt文件里写入字符串’难念的经’ 2.然后请你读取这个1.txt文件的内容,并打印出来。

提示:先写再读。写文件分为3步,读文件也同样分为3步。

参考代码:

f1 = open('./1.txt','a',encoding='utf-8') 
#以追加的方式打开一个文件,尽管并不存在这个文件,但这行代码已经创建了一个txt文件了
f1.write('难念的经')
#写入'难念的经'的字符串
f1.close()           
#关闭文件 
f2 = open('./1.txt','r',encoding='utf-8')
#以读的方式打开这个文件
content = f2.read()
#把读取到的内容放在变量content里面
print(content)
#打印变量content
f2.close()
#关闭文件

注:路径根据自己的实际路径来替换即可。


运行结果:

难念的经

我们再来总结下写文件的三步法。

14.png

现在问题来了,如果我们想写入的数据不是文本内容,而是音频和图片的话,该怎么做呢?15.png

我们可以看到里面有’wb’的模式,它的意思是以二进制的方式打开一个文件用于写入。因为图片和音频是以二进制的形式保存的,所以使用wb模式就好了,这在今天的课后作业我们会用到。

小技巧


这里再顺便补充一个用法,为了避免打开文件后忘记关闭,占用资源或当不能确定关闭文件的恰当时机的时候,我们可以用到关键字with,之前的例子可以写成这样:

# 普通写法
file1 = open('abc.txt','a') 
file1.write('张无忌') 
file1.close()
# 使用with关键字的写法
with open('abc.txt','a') as file1:
#with open('文件地址','读写模式') as 变量名:
    #格式:冒号不能丢
    file1.write('张无忌') 
    #格式:对文件的操作要缩进
    #格式:无需用close()关闭

所以之后当你看到with open…as这种打开文件的语法格式也要淡定,这种还挺常见的。

正所谓“光看不写,学这Python有何用”,接下来,我们还是一起写写代码噢 (p≧w≦q)!

小练习


我们一路到这里,你应该也看出来了,本人非常喜欢《哈利波特》哈哈。

现在假设你来到了魔法世界,最近期末快到了,霍格沃兹魔法学校准备统计一下大家的成绩。

评选的依据是什么呢?就是同学们平时的作业成绩。

现在有这样一个叫scores.txt的文件,里面有赫敏、哈利、罗恩、马尔福四个人的几次魔法作业的成绩。

image.png

但是呢,因为有些魔法作业有一定难度,教授不强制同学们必须上交,所以大家上交作业的次数并不一致。image.png

这里是文件内容,你可以在自己的电脑里新建一个scores.txt来操作。

罗恩 23 35 44
哈利 60 77 68 88 90
赫敏 97 99 89 91 95 90
马尔福 100 85 90

希望你来统计这四个学生的魔法作业的总得分,然后再写入一个txt文件。注意,这个练习的全程只能用Python。

面对这个功能,请你思考30s,粗略地想想该怎么实现?然后点击enter继续。

好,一个非常粗糙的思路应该是:拿到txt文件里的数据,然后对数据进行统计,然后再写入txt文件。好,马上开始。

首先,毫无疑问,肯定是打开文件,还记得用什么函数吗?

file1 = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8')

接着呢,就是读取文件了。一般来说,我们是用read()函数,但是在这里,我们是需要把四个人的数据分开处理的,我们想要按行处理,而不是一整个处理,所以读的时候也希望逐行读取。


因此,我们需要使用一个新函数readlines(),也就是“按行读取”。

file1 = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8') 
file_lines = file1.readlines()      
file1.close()
print(file_lines)

用print()函数打印一下,看看这种方法读出来的内容是咋显示的:

18.png

你看到了,readlines() 会从txt文件取得一个列表,列表中的每个字符串就是scores.txt中的每一行。而且每个字符串后面还有换行的\n符号。


这样一来,我们就可以使用for循环来遍历这个列表,然后处理列表中的数据,请看第五行代码:

file1 = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8') 
file_lines = file1.readlines()
file1.close()
for i in file_lines:    #用for...in...把每一行的数据遍历
    print(i)            #打印变量i

我们一样来打印看看

19.png

好,现在我们要把这里每一行的名字、分数也分开,这时需要我们使用split()来把字符串分开,它会按空格把字符串里面的内容分开。


看上图第一行的罗恩 23 35 44,它将被分为[‘罗恩’, ‘23’, ‘35’, ‘44’]。

file1 = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8') 
file_lines = file1.readlines()
file1.close()
for i in file_lines:   #用for...in...把每一行的数据遍历  
    data =i.split()    #把字符串切分成更细的一个个的字符串
    print(data)        #打印出来看看

终端是这样的:

20.png

显然,对比上面两个终端的图,split()又把每一行的内容分成了一个个的字符串,于是变成了一个个列表。

split()是我们没有学过的对字符串的处理方法,在这里,老师想插一句,对数据类型的处理是有很多种方法的,但我们不可能一次学完,而应该学习最基础必要的知识,然后在需要用到新知识时,再继续学。

split()是把字符串分割的,而还有一个join()函数,是把字符串合并的。

a=['c','a','t']
b=''
print(b.join(a))
c='-'
print(c.join(a))

运行结果:

cat
c-a-t

join()的用法是str.join(sequence),str代表在这些字符串之中,你要用什么字符串连接,在这里两个例子,一个是空字符串,一个是横杠,sequence代表数据序列,在这里是列表a。

在这里只是为了让大家理解join(),不需要记忆,之后再用再看就好。

回到哈利波特的那一步:

21.png

这4个列表的第0个数据是姓名,之后的就是成绩。我们需要先统计各人的总成绩,然后把姓名和成绩放在一起。


还是可以用for…in…循环进行加法的操作,请看第8行的代码:

file1 = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8') 
file_lines = file1.readlines()
file1.close()
for i in file_lines:
    data =i.split()    
    sum = 0                    #先把总成绩设为0
    for score in data[1:]:     #遍历列表中第1个数据和之后的数据
        sum = sum + int(score) #然后依次加起来,但分数是字符串,所以要转换    
    result = data[0]+str(sum)  #结果就是学生姓名和总分
    print(result)

来看看终端:

22.png好,接下来就是把成绩写入一个空的列表,因为这样才有助于我们之后写入一个txt文件。

file1 = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8') 
file_lines = file1.readlines()
file1.close()
final_scores = []                        #新建一个空列表
for i in file_lines:
    data =i.split()    
    sum = 0                    
    for score in data[1:]:     
        sum = sum + int(score)     
    result = data[0]+str(sum)+'\n'       #后面加上换行符,写入的时候更清晰。    
    final_scores.append(result)#每统计一个学生的总分,就把姓名和总分写入空列表

好啦,那我们就已经处理好了,就差写入文件啦。大家可以从第15行开始看:

file = open('/Users/Ted/Desktop/scores.txt','r',encoding='utf-8') 
file_lines = file.readlines()
file.close()
final_scores = [] 
for i in file_lines:
    data =i.split()    
    sum = 0                    
    for score in data[1:]:     
        sum = sum + int(score)     
    result = data[0]+str(sum)+'\n'    
    final_scores.append(result)
winner = open('/Users/Ted/Desktop/winner.txt','w',encoding='utf-8')   # 从这行开始看
winner.writelines(final_scores)
winner.close()

15行的代码是打开一个叫winner.txt的文件。(如果电脑中不存在winner.txt的话,这行代码会帮你自动新建一个空白的winner.txt)

16行的代码是以writelines()的方式写进去,为什么不能用write()?因为final_scores是一个列表,而write()的参数必须是一个字符串,而writelines()可以是序列,所以我们使用writelines()。

17行代码是关闭文件。这个,你记得不要把括号丢掉就好。

这个小练习里,我们增加了一些新的函数用法,并不是很难,只是对你来说暂时还有些陌生,但它们与我们学过的函数其实都有联系,或是用法大有相似之处,你只需要熟悉它,等要用的时候翻出来就好啦。

而且,相比于我们已经翻越过的几座大山,也就是前几个项目实操关卡,这个小练习应该只能算一个轻轻松松就能越过的小山坡,对吧?

好,以上就是本关的内容啦~课程就讲到这里,不要小看这两大块知识,要多多复习噢!去做练习吧!

相关文章
|
1月前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
2月前
|
监控 网络安全 开发者
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
61 20
|
2月前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
103 8
|
2月前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
2月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
3月前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
88 7
|
5月前
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
763 60
|
5月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
167 3
python知识点100篇系列(15)-加密python源代码为pyd文件
|
5月前
|
Linux 区块链 Python
Python实用记录(十三):python脚本打包exe文件并运行
这篇文章介绍了如何使用PyInstaller将Python脚本打包成可执行文件(exe),并提供了详细的步骤和注意事项。
210 1
Python实用记录(十三):python脚本打包exe文件并运行
|
4月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
198 2

热门文章

最新文章

推荐镜像

更多