@[toc]
1.文件操作
文件的作用: 可以永久的保存数据.
文件在硬盘中存储的格式是二进制.
打开文件
读写文件
关闭文件
1.1读文件-r
打开文件, 是文件从硬盘中存到内存中
open(file, mode='r', encoding)
file 要操作的文件名字, 类型是 str
mode, 文件打开的方式, r(read) 只读打开, w(write) 只写打开 a(append) 追加打开
encoding 文件的编码格式, 常见的编码格式有两种, 一种是gbk, 一种是utf-8
返回值, 文件对象, 后续所有的文件操作,都需要通过这个文件对象进行
# 以只读的方式打开当前目录中,text1.txt 文件, 文件不存在会报错
f = open('text1.txt', 'r')
# 2. 读文件 文件对象.read()
buf = f.read()
print(buf)
# 3. 关闭文件 文件.close() 将内存中三大文件同步到硬盘中
f.close()
1.2写文件-w
- open函数打开文件,没有指定文件的编码,windows默认是gbk,Mac和linux默认是utf-8
- write函数将“你好,中国”写入文件中,使用gbk编码写入
- 在pycharm中双击打开文件,默认使用的编码是utf-8
- 使用utf-8编码打开gbk 编码的数据,出现乱码
编码︰就是如何将中文汉字变为二进制,或者如何将二进制转换为汉字
解决方案:是两种方式的编码统─即可
方案一:open打开文件的时候,指定使用utf-8打开
方案二: pycharm中使用gbk 的方式打开
1.2.1方案一:
# 1. 打开文件 w 方式打开文件,文件不存在,会创建文件, 文件存在,会覆盖清空原文件
f = open('a.txt', 'w', encoding='utf-8')
# 2. 写文件 文件对象.write(写入文件的内容)
f.write('hello world!\n')
f.write('hello python!\n')
f.write('你好,中国!')
# 3. 关闭文件
f.close()
1.2.2方案二:
将这里改成GBK
1.3追加文件-a
a 方式打开文件, 追加内容,在文件的末尾写入内容
文件不存在,会创建文件
注意点: 不管是a 方式打开文件,还是 w 方式打开文件,写内容,都是使用 write()函数
f = open('b.txt', 'a', encoding='utf-8')
# f.write('hello world!\n')
f.write('123\n')
f.close()
1.4文件的读操作
1.4.1read()
# 1. 打开文件
f = open('a.txt', 'r', encoding='utf-8')
# 2. 读写文件 文件对象.read(n) n 一次读取多少字节的内容,默认不写,读取全部内容
buf = f.read(3)
print(buf) # 123
print('-'*30)
buf = f.read(3) #
print(buf)
# 3. 关闭文件
f.close()
1.4.2按行读取
.strip是可以把字符串中的空格\n去掉
f = open('a.txt', 'r', encoding='utf-8')
# f.readline() # 一次读取一行的内容, 返回值是读取到的内容(str)
# buf = f.readline()
# f.readlines() # 按行读取,一次读取所有行,返回值是列表, 列表中的每一项是一个字符串,即一行的内容
buf = f.readlines()
print(buf) # ['1234\n', '5678']
buf = [i.strip() for i in buf]
print(buf) # ['1234', '5678']
f.close()
1.4.3模拟读取大文件
end=''打印的时候不会换行
情况一:大文件分为好几行
f = open('a.txt', 'r', encoding='utf-8')
while True:
buf = f.readline()
if buf: # if len(buf) > 0 容器,可以直接作为判断条件,容器中有内容,为True,没有数据是False
print(buf, end='')
else:
# 文件读完了
break
f.close()
情况二:大文件只有一行
f = open('b.txt', 'r', encoding='utf-8')
while True:
buf = f.read(5) # f.read(4096)
if buf:
# print(buf, end='')
print(buf)
else:
break
f.close()
4.4.4补充: 计算机中的大小
计算机只认识 0 和 1 ,
进制:
二进制, 只有 0 和 1 组成,逢二进一
十进制, 0 1 2 3 4 5 6 7 8 9 , 逢十进一
十六进制, 0 1 2 3 4 5 6 7 8 9 A B C D E F 逢十六进一
计算机最小的单位是 bit(位), 只有两个数据值 0 和 1
字节: 是计算机中基本的储存单位 byte
1 byte = 8 bit
1KB = 1024 byte
1MB = 1024 KB
1GB = 1024 MB
1TB = 1024 GB
...
100Mbits 200Mbits
12.5MB/s 25MB/s
1.5文件打开模式
文本文件: txt, .py .md 能够使用记事本打开的文件
二进制文件: 具有特殊格式的文件, mp3 mp4 rmvb avi png jpg 等
文本文件可以使用 文本方式打开文件,也可以使用二进制的方式打开文件
二进制文件,只能使用二进制的方式打开文件
二进制打开方式如下: 不管读取,还是书写,都需要使用二进制的数据
rb wb ab
注意点: 不能指定 encoding 参数
encode() 将str 转换为二进制格式的字符串
decode() 将二进制格式的字符串转换为str
f = open('c.txt', 'wb')
f.write('你好'.encode()) # encode() 将str 转换为二进制格式的字符串
f.close()
f1 = open('c.txt', 'rb')
buf = f1.read()
print(buf)
print(buf.decode())
f1.close()
1.6应用-文件备份
- 用只读的方式,打开文件
- 读取文件内容
- 关闭文件
- 只写的方式,打开新文件
- 将 第 2 步读取的内容写入新文件
- 关闭新文件
思考:
- 如果文件比较大,循环读取文件
- 复制备份的文件可能是 txt 文件,可能是 二进制文件, ---> 使用二进制方式打开文件
普通备份
# 1. 用只读的方式,打开文件
f = open('a.txt', 'rb')
# 2. 读取文件内容
buf = f.read()
# 3. 关闭文件
f.close()
# 4. 只写的方式,打开新文件
f_w = open('a[备份].txt', 'wb')
# 5. 将 第 2 步读取的内容写入新文件
f_w.write(buf)
# 6. 关闭新文件
f_w.close()
优化备份
file_name = input('请输入要备份的文件名')
# 1. 用只读的方式,打开文件
f = open(file_name, 'rb')
# 2. 读取文件内容
buf = f.read()
# 3. 关闭文件
f.close()
# 根据原文件名,找到文件后缀和文件名
index = file_name.rfind('.')
# 后缀 file_name[index: ]
# 新文件名
new_file_name = file_name[:index] + '[备份]' + file_name[index:]
print(new_file_name)
# 4. 只写的方式,打开新文件
f_w = open(new_file_name, 'wb')
# 5. 将 第 2 步读取的内容写入新文件
f_w.write(buf)
# 6. 关闭新文件
f_w.close()
为什么要用rfind呢,是因为如果文件名为a.b.txt则也可以正确的找到txt后缀
1.7文件和文件夹的操作
1.7.1文件重命名
import os
os.rename("ab.txt", "abcc.txt")
1.7.2删除文件
import os
os.remove("abcc.txt")
1.7.3创建文件夹
import os
os.mkdir("诸葛亮")
1.7.4获取当前目录
import os
os.getcwd()
1.7.5改变默认目录
import os
os.chdir("../")
1.7.6获取目录列表
import os
os.listdir("./")
1.7.7删除文件夹
import os
os.rmdir("诸葛亮")
# 对文件和目录的操作,需要导入 os 模块
import os
# 1. 文件重命名 os.rename(原文件路径名, 新文件路径名)
os.rename('ab.txt', 'abcc.txt')
# 2. 删除文件 os.remove(文件的路径名)
os.remove('abcc.txt')
# 3. 创建目录 os.mkdir(目录路径名) make directory
os.mkdir('test')
os.mkdir('test/aa')
# 4. 删除空目录 os.rmdir(目录名) remove directory
os.rmdir('test/aa')
os.rmdir('test')
# 5. 获取当前所在的目录 os.getcwd() get current working directory
buf = os.getcwd()
print(buf)
# 6. 修改当前的目录 os.chdir(目录名) change dir
os.chdir('test')
buf = os.getcwd()
print(buf)
# 7. 获取指定目录中的内容, os.listdir(目录), 默认不写参数,是获取当前目录中的内容
# 返回值是列表, 列表中的每一项是文件名
buf = os.listdir() # test
print(buf)
1.8应用-批量修改文件名
import os
# 批量创建txt文本
def create_files():
for i in range(10):
file_name = 'test/file_' + str(i) + '.txt'
print(file_name)
f = open(file_name, 'w')
f.close()
# 批量创建txt文本
def create_files_1():
os.chdir('test')
for i in range(10, 20):
file_name = 'file_' + str(i) + '.txt'
print(file_name)
f = open(file_name, 'w')
f.close()
os.chdir('../') # ../ 上一级目录
# 批量修改文本名字
def modify_filename():
os.chdir('test')
buf_list = os.listdir()
# print(buf_list)
for file in buf_list:
new_file = 'py43_' + file
os.rename(file, new_file)
os.chdir('../')
# 批量修改文本名字
def modify_filename_1():
os.chdir('test')
buf_list = os.listdir()
# print(buf_list)
for file in buf_list:
num = len('py43_')
new_file = file[num:]
os.rename(file, new_file)
os.chdir('../')
# create_files()
# create_files_1()
# modify_filename()
# modify_filename_1()