文件操作的三个步骤:
1,打开文件,得到文件句柄并赋值给一个变量
2.通过句柄对文件进行操作
3.关闭文件
一、打开关闭文件
必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写
f = open('a.txt', mode='rt',encoding='utf-8')
f.close()
f.close()是向操作系统发送请求,要求操作系统关闭打开的文件,文件打开后,一定要在程序结束前关闭!
with语句:为了防止忘记关闭文件,Python的上下文管理with语句可以很方便的使用
with open('a.txt', mode='rt', encoding='utf-8') as f: pass # 打开多个文件 with open('a.txt', mode='rt', encoding='utf-8') as f,open('b.txt', mode='rt', encoding='utf-8')as f1: pass
二、文件基本操作
- r:只读模式, 默认模式,文件必须存在不存在则抛出异常
- w:只写模式, 不可读,文件不存在则创建,存在则清空内容
- a:追加模式, 可读,可写,文件不存在则创建,存在则在最后一行追加内容
用"+"可以表示同时读写某个文件
- r+ 可读可写
- w+ 可读可写 消除文件内容,然后以写读的方式打开文件
- a+ 可读可写 以读写方式打开文件,并把文件指针移到文件尾
注意:r默认打开的是text格式,rb,wb,ab读取到的内容都是byte字节,写入时也要提供字节类型,后面的字符编码不能添加.
with open('a.txt', mode='rb',) as f: a = f.read() print(a) #输出为二进制b'\xe6\xaf\x8f\xe5\xa4\xa9\xe9\x83\xbd\xe5\xad\xa6\xe4\xb9\xa0' print(a.decode())#每天都学习
rb模式每次读取一个字节,rt模式每次读取的是一个字符串
with open('a.txt', mode='rb',) as f: a = f.read(3) print(a)#b'\xe6\xaf\x8f' with open('a.txt', mode='rt',encoding='utf-8') as f: print(f.read(2))#每天
with open('a.txt', mode='rt',encoding='utf-8') as f: print(f.read(2))#每天 读取前面两个字符串 with open('a.txt', mode='rt',encoding='utf-8') as f: print(f.read())全部读取 with open('a.txt', mode='rt',encoding='utf-8') as f: print(f.readline())#每次读取一行 print(f.readline()) with open('a.txt', mode='rt',encoding='utf-8') as f: print(f.readlines())#将读出来的内容存在一个列表中 print(f.readable())#是否可读
with open('b.txt', mode='wb') as f: f.write('abc你好'.encode('utf-8')) #写入内容至b.txt # a = ["菜鸟教程 1\n", "菜鸟教程 2"] # f.writelines(a)# 将列表写入,字节情况下无法写入 print(f.readable())# Fales print(f.writable())# True
with open('b.txt', mode='a', encoding='utf-8') as f: print(f.tell())#鼠标指针当前位置 f.write('qwe')# 在文件内容后面添加'qwe' print(f.tell())#鼠标指针当前位置
控制指针移动:
f.seek(offset,whence)
offset:代表控制指针移动的字节数
whence:代表参照什么位置移动
- whence =0:参照文件开头 特殊:可以在t和b模式下使用
- whence =1:参照当前所在位置,必须在b模式下使用
- whence =2:参照文件末尾,必须在b模式下使用
# with open('a.txt', mode='rt', encoding='utf-8') as f: # f.seek(6, 0)#移动的是字节数,三个字节为一个汉字 # msg = f.read(1) # print(msg) # with open('a.txt', mode='rb') as f: # f.seek(3, 1) # msg = f.read(6) # msg = f.read(5)#报错,因为汉字为三个字节 # print(msg.decode('utf-8')) #参照末尾 with open('a.txt', mode='rb') as f: f.seek(-3, 2) print(f.tell()) msg = f.read(3) print(msg.decode('utf-8'))
三、文件修改
方式一:
将文件内容由硬盘全部读入内存,在内存中完成修改,将内存中修改的结果覆盖写会硬盘
with open('a.txt',mode='rt', encoding='utf-8') as f: all_data = f.read() all_data = all_data.replace('你','zfj') with open('a.txt', mode='wt', encoding='utf-8') as f: f.write(all_data)
方式二:
1.以读的方式打开源文件,以写的方式打开一个临时文件
2.从源文件中每读一行内容,修改完毕后写入临时文件,直到源文件读取完毕
3.删掉源文件,将临时文件重命名为源文件
import os with open('a.txt', mode='rt', encoding='utf-8') as f,open('a_swap.txt',mode='wt', encoding='utf-8')as f1: for i in f: f1.write(i.replace('哎呀呀','zfj')) os.remove('a.txt') os.rename('a_swap.txt', 'a.txt')
总结:
方式一:在文件修改过程中硬盘上始终一份数据,内存占用过多,不适用于大文件
方式二:在同一时刻内存中只存放源文件一行内容,不会占用过多内存,缺点是在文件修改过程中硬盘同时存在两份数据
每天都要学习!
焚膏油以继晷,恒兀兀以穷年。