文件的编码
思考:计算机只能识别:0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中呢?
答案:使用编码技术(密码本)将内容翻译成0和1存入。
编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。
不同的编码,将内容翻译成二进制也是不同的。
编码有许多,所以要使用正确的编码, 才能对文件进行正确的读写操作呢。
如上,如果你给喜欢的女孩发送文件,使用编码A进行编码(内容转二进制)。 女孩使用编码B打开文件进行解码(二进制反转回内容)
查看文件编码
我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么:
UTF-8是目前全球通用的编码格式 除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。
文件的读取
什么是文件
内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U 盘等设备。为了便于数据的管理和检索,引入了“文件”的概念。
一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。
文件操作包含哪些内容呢?
在日常生活中,文件操作主要包括打开、关闭、读、写等操作。
文件的操作步骤
想想我们平常对文件的基本操作,大概可以分为三个步骤(简称文件操作三步走):
① 打开文件 ② 读写文件 ③ 关闭文件
注意:可以只打开和关闭文件,不进行任何读写
open()打开函数
在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下
name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
mode:设置打开文件的模式(访问模式):只读、写入、追加等。
encoding:编码格式(推荐使用UTF-8) 示例代码:
注意:此时的`f`是`open`函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问,后续面向对象课程会给大家进行详细的介绍。
mode常用的三种基础访问模式
读操作相关方法
read()方法:
文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
readlines()方法: readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。
f = open('python.txt') content = f.readlines() # ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc'] print(content) # 关闭文件 f.close()
readlines()方法:
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。
f = open('python.txt') content = f.readlines() # ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc'] print(content) # 关闭文件 f.close()
readline()方法:一次读取一行内容
f = open('python.txt') content = f.readline() print(f'第一行:{content}') content = f.readline() print(f'第二行:{content}') # 关闭文件 f.close()
for循环读取文件行
for line in open("python.txt", "r"): print(line) # 每一个line临时变量,就记录了文件的一行数据
close() 关闭文件对象
f = open("python.txt", "r") f.close() # 最后通过close,关闭文件对象,也就是关闭对文件的占用 # 如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用。
with open 语法
with open("python.txt", "r") as f: f.readlines() # 通过在with open的语句块中对文件进行操作 # 可以在操作完成后自动关闭close文件,避免遗忘掉close方法
1. 操作文件需要通过open函数打开文件得到文件对象
2. 文件对象有如下读取方法: read() readline() readlines() for line in 文件对象
3. 文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被一直占用
文件的写入
# 1. 打开文件 f = open('python.txt', 'w') # 2.文件写入 f.write('hello world') # 3. 内容刷新 f.flush()
注意:
直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
当调用flush的时候,内容会真正写入文件
这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
写操作注意
文件如果不存在,使用”w”模式,会创建新文件
文件如果存在,使用”w”模式,会将原有内容清空
1. 写入文件使用open函数的”w”模式进行写入
2. 写入的方法有: wirte(),写入内容 flush(),刷新内容到硬盘中
3. 注意事项: w模式,文件不存在,会创建新文件 w模式,文件存在,会清空原有内容 close()方法,带有flush()方法的功能
文件的追加
# 1. 打开文件,通过a模式打开即可 f = open('python.txt', 'a') # 2.文件写入 f.write('hello world') # 3. 内容刷新 f.flush()
注意:
a模式,文件不存在会创建文件
a模式,文件存在会在最后,追加写入文件
. 1.追加写入文件使用open函数的”a”模式进行写入
2. 追加写入的方法有(和w模式一致): wirte(),写入内容 flush(),刷新内容到硬盘中
3. 注意事项: a模式,文件不存在,会创建新文件 a模式,文件存在,会在原有内容后面继续写入 可以使用”\n”来写出换行符