Python 文件的操作

简介: Python 文件的操作文件的基础操作笔记

引子:

现在这个世界上,如果可以操作文件的所有软件都消失了,比如word,wps等等,此时你的朋友通过qq给你发过来一个文件,文件名是:美女模特空姐护士联系方式.txt,在座的所有男同学,那么你接受到这个文件之后,你的内心是否有一丝冲动,当然咱们不是那种闷骚的人,其实我们就是比较好奇,就是想要看看里面写的是什么,仅此而已,绝不联系。但是我说了所有可以操作文件的软件全部都没了,那么你是不是百爪挠心,火急火燎,哎呀。别急呀,你忘了么?你学过Python这门编程语言,这个语言肯定有能操控文件的功能。我相信在这种强大的动力下,你是可以,必须能学会的。

那么假设,现在让你用Python开发一个软件来操作这个文件,你觉得你需要什么必要参数呢?

  文件路径:D:\美女模特空姐护士联系方式.txt  (你想操作这个文件,必须要知道这个文件的位置)

  编码方式:utf-8,gbk,gb2312....  (昨天刚讲完编码,文件其实就是数据的存储,数据存储你需要编码知道这个数据是以什么编码存储的)

  操作模式:只读,只写,追加,写读,读写....

计算机系统分为:计算机硬件,操作系统,应用程序三部分。

我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,
这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。
操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,
其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久保存下来。

文件操作的内容流程
此时你需要先利用软件创建一个文件,文件里面随便写一些内容,然后保存在任意磁盘(路径尽量要简单一些)中。

然后创建一个py文件,利用Python代码打开这个文件。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode="r", encoding="utf-8")
content = file1.read()
print(content)
file1.close()
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
101 ways to Learn English
Don't be afraid to make mistakes. ...
Surround yourself in English. ...
Practise every day. ...
Tell your family and friends about your study plan. ...
Practise the 4 core skills: reading, writing, speaking and listening. ...
Keep a notebook of new words you learn.

Process finished with exit code 0
接下来就是对上面代码的解释:

file1: 就是一个变量,一般都会将它写成f,f_obj,file,f_handler,fh,等,它被称作文件句柄。

open:是Python调用的操作系统(windows,linux,等)的功能。

"/home/yuchuan/YuchuanData/PythonData/temp/china.txt": 这个是文件的路径。

mode: 就是定义你的操作方式:r为读模式。

encoding: 不是具体的编码或者解码,他就是声明:此次打开文件使用什么编码本。一般来说:你的文件用什么编码保存的,就用什么方法打开,一般都是用utf-8(有些使用的是gbk)。

f.read():你想操作文件,比如读文件,给文件写内容,等等,都必须通过文件句柄进行操作。

close(): 关闭文件句柄(可以把文件句柄理解成一个空间,这个空间存在内存中,必须要主动关闭)。

上面的参数解释
有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode="r", encoding="utf-8")

2、通过句柄操作文件。

content = file1.read()
print(content)

3、关闭文件

file1.close()
练习上面代码,可能出现的问题:

  1. 路径问题。

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
Traceback (most recent call last):
File "/home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py", line 2, in

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp1/china.txt", mode="r", encoding="utf-8")

FileNotFoundError: [Errno 2] No such file or directory: '/home/yuchuan/YuchuanData/PythonData/temp1/china.txt'

Process finished with exit code 1
没有匹配的文件或目录:No such file or directory: 路径错误或者是没有此文件名的文件。

你的的路径里面的与后面的字符产生了某种'化学反应',这个截图中的D此时就不是路径分隔符了,D就有了特殊意义,其实跟t,n,换行符一样,所以针对这种情况,你应该这样解决:

解决方式一: 'C:\\Users\金鑫\Desktop\\111.txt' 凡是路径会发生化学反应的地方,多加一个\ 这样就是前面\对后面的\进行转译,告诉计算机这个只是想单纯的表示\路径而已。

解决方式二: r'C:\\Users\金鑫\Desktop\\111.txt' 在路径的整体前面加一个r。(推荐)

相对路径与绝对路径:

  1.绝对路径:从磁盘根目录开始一直到文件名

  2.相对路径:用一个文件夹下的文件,相对于当前这个程序所在的文件而言.如果在同一个文件中,则相对路劲就是这个文件名.如果再上一层文件夹则要使用../相对路径下,你就可以直接写文件名即可。

  1. 编码的问题

1574258428262445.png这个问题就是你打开文件的编码与文件存储时的编码用的编码本不一致导致的。比如这个文件当时用word软件保存时,word软件默认的编码为utf-8,但是你利用python代码打开时,用的gbk,那么这个就会报错了。

文件操作的操作模式分为三个类:读,写,追加。每一类又有一些具体的方法,那么接下来我们就分类研究这些方法。

二. 文件操作:读
 2.1 r模式
以只读方式打开文件,文件的指针将会放在文件的开头。是文件操作最常用的模式,也是默认模式,如果一个文件不设置mode,那么默认使用r模式操作文件。

举例说明:

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", encoding="utf-8")

2、通过句柄操作文件。

content = file1.read()

3、关闭文件

file1.close()

print(content)
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
101 ways to Learn English
Don't be afraid to make mistakes. ...
Surround yourself in English. ...
Practise every day. ...
Tell your family and friends about your study plan. ...
Practise the 4 core skills: reading, writing, speaking and listening. ...
Keep a notebook of new words you learn.

Process finished with exit code 0
通过上面的例子可以看出来,我将china.txt这个文件的内容全部读取出来了,那么读一个文件还可以怎么读取呢?下面我们研究一下不同的读文件的方法。

2.1.1 read()
read()将文件中的内容全部读取出来;弊端 如果文件很大就会非常的占用内存,容易导致内存奔溃.

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode='r', encoding="utf-8")

2、通过句柄操作文件。

content = file1.read()

3、关闭文件

file1.close()

print(content)

2.1.2 read(n)

read()读取的时候指定读取到什么位置

在r模式下,n按照字符读取。

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode='r', encoding="utf-8")

2、通过句柄操作文件。

content = file1.read(10)
content1 = file1.read()

3、关闭文件

file1.close()

print(content)
print(content1)
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
101 ways t #content

o Learn English
Don't be afraid to make mistakes. ...
Surround yourself in English. ...
Practise every day. ...
Tell your family and friends about your study plan. ...
Practise the 4 core skills: reading, writing, speaking and listening. ...
Keep a notebook of new words you learn.

Process finished with exit code 0

2.1.3 readline()

readline()读取每次只读取一行,注意点:readline()读取出来的数据在后面都有一个n

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode='r', encoding="utf-8")

2、通过句柄操作文件。

msg1 = file1.readline()
msg2 = file1.readline()
msg3 = file1.readline()
msg4 = file1.readline()
msg5 = file1.readline()

3、关闭文件

file1.close()

print(msg1)
print(msg2)
print(msg3)
print(msg4)
print(msg5)
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
101 ways to Learn English

Don't be afraid to make mistakes. ...

Surround yourself in English. ...

Practise every day. ...

Tell your family and friends about your study plan. ...

Process finished with exit code 0
解决这个问题只需要在我们读取出来的文件后边加一个strip()就OK了

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode='r', encoding="utf-8")

2、通过句柄操作文件。

msg1 = file1.readline().strip()
msg2 = file1.readline().strip()
msg3 = file1.readline().strip()
msg4 = file1.readline().strip()
msg5 = file1.readline().strip()

3、关闭文件

file1.close()

print(msg1)
print(msg2)
print(msg3)
print(msg4)
print(msg5)
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
101 ways to Learn English
Don't be afraid to make mistakes. ...
Surround yourself in English. ...
Practise every day. ...
Tell your family and friends about your study plan. ...

Process finished with exit code 0

2.1.4 readlines()

readlines() 返回一个列表,列表里面每个元素是原文件的每一行,如果文件很大,占内存,容易崩盘。

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode='r', encoding="utf-8")

2、通过句柄操作文件。

print(file1.readlines())

3、关闭文件

file1.close()
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
['101 ways to Learn Englishn',
"Don't be afraid to make mistakes. ...n",
'Surround yourself in English. ...n',
'Practise every day. ...n',
'Tell your family and friends about your study plan. ...n',
'Practise the 4 core skills: reading, writing, speaking and listening. ...n',
'Keep a notebook of new words you learn.n'
]

Process finished with exit code 0

上面这四种都不太好,因为如果文件较大,他们很容易撑爆内存,所以接下来我们看一下第五种:

    2.1.5 for循环

可以通过for循环去读取,文件句柄是一个迭代器,他的特点就是每次循环只在内存中占一行的数据,非常节省内存。

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

file1 = open("/home/yuchuan/YuchuanData/PythonData/temp/china.txt", mode='r', encoding="utf-8")

2、通过句柄操作文件。

for line in file1:

print(line.strip())

3、关闭文件

file1.close()
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
101 ways to Learn English
Don't be afraid to make mistakes. ...
Surround yourself in English. ...
Practise every day. ...
Tell your family and friends about your study plan. ...
Practise the 4 core skills: reading, writing, speaking and listening. ...
Keep a notebook of new words you learn.

Process finished with exit code 0
注意点:读完的文件句柄一定要关闭

2.2 rb模式
rb模式:以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。记住下面讲的也是一样,带b的都是以二进制的格式操作文件,他们主要是操作非文字文件:图片,音频,视频等,并且如果你要是带有b的模式操作文件,那么不用声明编码方式。

可以网上下载一个图片给同学们举例:

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

fd = open("/home/yuchuan/Pictures/004.png", mode="rb")
for line in fd:

print(line)

fd.close()

1、打开文件,得到文件句柄,并且复制给一个变量。默认打开模式九尾r。

fd = open("/home/yuchuan/Pictures/004.png", mode="rb")

msg = fd.read()
print(msg)

for line in fd:

print(line)

fd.close()
结果

/home/yuchuan/YuchuanData/PythonData/PythonProject/venv/bin/python /home/yuchuan/YuchuanData/PythonData/PythonProject/YuchuanPythonDemo03.py
b'x89PNGrnx1anx00x00x00rIHDRx00x00x02xb4x00x00x02xb3x08x06x00x00x00xef;12x90@x1bxddxbaUxc9D@x04jx89xc0x0e;......

Process finished with exit code 0
当然rb模式也有read read(n) readline(),readlines() for循环这几种方法,我在这就不一一演示了。

三. 文件操作:写

第二类就是写,就是在文件中写入内容。这里也有四种文件分类主要四种模式:w,wb,w+,w+b,我们只讲w,wb。

3.1 w模式

  如果文件不存在,利用w模式操作文件,那么它会先创建文件,然后写入内容.

fd = open("demo001.txt", mode="w", encoding="utf-8")
str1 = "世界你好"
fd.write(str1)
fd.close()
结果

1574425381175646.png

如果文件存在,利用w模式操作文件,先清空原文件内容,在写入新内容。

fd = open("demo001.txt", mode="w", encoding="utf-8")
str2 ="美好的明天才刚刚开始,请珍惜每一天"
fd.write(str2)
fd.close()
运行前:

1574425711753533.png

运行后:

1574425821552816.png

3.2 wb模式

  wb模式:以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如:图片,音频,视频等。

举例说明:

我先以rb的模式将一个图片的内容以bytes类型全部读取出来,然后在以wb将全部读取出来的数据写入一个新文件,这样我就完成了类似于一个图片复制的流程。具体代码如下:

fd1 = open("/home/yuchuan/Pictures/001.png", mode="rb")
fd2 = open("/home/yuchuan/Pictures/111.png", mode="wb")
flag = 1
while flag:

content = fd1.readline()
fd2.write(content)
if not content:  # 等价于if content == "":
    flag = 0

fd1.close()
fd2.close()
结果:

1574427778258062.png

四. 文件操作:追加
第三类就是追加,就是在文件中追加内容。这里也有四种文件分类主要四种模式:a,ab,a+,a+b,我们只讲a。

4.1 a模式

打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

  如果文件不存在,利用a模式操作文件,那么它会先创建文件,然后写入内容。

fd = open("demo002.txt", mode="a+", encoding="utf-8")
str1 = "努力才能突破,突破自己"
fd.write(str1)
fd.close()
结果:

1574429481197217.png

如果文件存在,利用a模式操作文件,那么它会在文件的最后面追加内容。

fd = open("demo002.txt", mode="a+", encoding="utf-8")
str2 = "继续接着努力,成功飞跃"
fd.write(str2)
fd.close()
结果:

1574429917414251.png

五. 文件操作的其他模式
大家发现了没有,咱们还有一种模式没有讲,就是那种带+号的模式。什么是带+的模式呢?+就是加一个功能。比如刚才讲的r模式是只读模式,在这种模式下,文件句柄只能进行类似于read的这读的操作,而不能进行write这种写的操作。所以我们想让这个文件句柄既可以进行读的操作,又可以进行写的操作,那么这个如何做呢?这就是接下来要说这样的模式:r+ 读写模式,w+写读模式,a+写读模式,r+b 以bytes类型的读写模式.........

在这里咱们只讲一种就是r+,其他的大同小异,自己可以练练就行了。

1. 打开文件的模式有(默认为文本模式):

r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】
a, 只追加写模式【不可读;不存在则创建;存在则只追加内容】

2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)

rb
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

3,‘+’模式(就是增加了一个功能)

r+, 读写【可读,可写】
w+,写读【可写,可读】
a+, 写读【可写,可读】

4,以bytes类型操作的读写,写读,写读模式

r+b, 读写【可读,可写】
w+b,写读【可写,可读】
a+b, 写读【可写,可读】
5.1 r+模式
r+: 打开一个文件用于读写。文件指针默认将会放在文件的开头。

fd = open("demo002.txt", mode="r+", encoding="utf-8")
content1 = fd.read()
print(content1)

str1 = "。快快乐乐继续前进"
fd.write(str1)
fd.close()

结果:

1574431050192070.png

目录
相关文章
|
1月前
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
332 60
|
1月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
17天前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
17 2
|
1月前
|
Linux 区块链 Python
Python实用记录(十三):python脚本打包exe文件并运行
这篇文章介绍了如何使用PyInstaller将Python脚本打包成可执行文件(exe),并提供了详细的步骤和注意事项。
55 1
Python实用记录(十三):python脚本打包exe文件并运行
|
1月前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
1月前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
1月前
|
JSON 数据格式 Python
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
这篇文章介绍了一个Python脚本,用于统计TXT或JSON文件中特定单词的出现次数。它包含两个函数,分别处理文本和JSON文件,并通过命令行参数接收文件路径、目标单词和文件格式。文章还提供了代码逻辑的解释和示例用法。
44 0
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
|
1月前
|
存储 索引 Python
一文让你搞懂 Python 的 pyc 文件
一文让你搞懂 Python 的 pyc 文件
110 10
|
1月前
|
Python
Python对PDF文件页面的旋转和切割
Python对PDF文件页面的旋转和切割
|
1月前
|
计算机视觉 Python
Python操作PDF文件
Python操作PDF文件