Python(3):文件读写与异常

简介: 访问路径: 文件读写必然涉及到文件会放在某个路径下。在python里,可以通过引入os包来实现切换当前访问的路径: 1 # 假设我在 /home/zyq/KiDe/Python/test 文件夹中有一个文件 test.txt 那么我可以通过以下命 令定位到该文件夹: 2 >>>import os 3 >>>os.chdir('/home/zyq/KiDe/Python/test') 4 # 此时可以通过 os.getcwd() 来得到当前的工作目录。

访问路径:

文件读写必然涉及到文件会放在某个路径下。在python里,可以通过引入os包来实现切换当前访问的路径:

 1 # 假设我在 /home/zyq/KiDe/Python/test 文件夹中有一个文件 test.txt 那么我可以通过以下命    令定位到该文件夹:
 2 >>>import os
 3 >>>os.chdir('/home/zyq/KiDe/Python/test')
 4 # 此时可以通过 os.getcwd() 来得到当前的工作目录。 
 5 # 此时可以通过如果下命令来进行文件读取测试:
 6 >>>data = open('test.txt')        
 7 >>>print(data.readline(), end='')
 8 This is line1
 9 >>>print(data.readline(), end='')
10 This is line2
11 >>>data.seek(0)                        # 此时将游标又放到了文件最开始
12 >>> for each_line in data:    
13         print(each_line, end='')
14 >>>data.close()                        # 一定要记得关闭读取流
DirRead

 

读写实例:

这里我们来处理另一个类似的文件。只不过这个文件可以看做是两个人对话的文件,文件内容如下:

 1 Man: You didn't!
 2 Other Man:I'm telling you, I did!
 3 Man: You did not!
 4 Other Man:Oh I'am sorry, is this a five minute argument,or the full of the half hour?
 5 Man:Ah!(taking out his wallet and paying) Just the five minutes.
 6 Other Man:Just the five minutes. Thank you.
 7 Other Man:Anyway, I did.
 8 Man:You most certainly did not!
 9 Other Man:Now let's get one thing quite clear:I most definitely old you!
10 Pause
11 Man:Oh no you didn't!
12 Other Man: Oh yes I did!
13 End
Talk.txt

这个文件假设为test2.txt,假设我们需要处理每一行的数据,将每个人的对话区别开来,我们可以使用python内置的split函数, 针对每一行数据采用如下:
(role, line_spoken) = each_line.split(":")。假设我们以此采用该代码来处理每一行,会发现报了一个:  ValueError:to many values to upack (expected 2) 。这是由于 Other Man:Now let's get one thing quite clear:I most definitely old you! 这一句出现了两个 ":" 。
 
我们可以通过 help(split)来查看split函数说明,看先是否有可以选择的参数来实现我们所需。

可以看到有一个 maxsplit参数来指定,对于间隔符的处理次数,我们这里只要得到两部分,即只要处理一次即可,所以可以修改每行读取函数为:

1 >>>for each_line in data:
2 >>>    (role, line_spoke) = each_line.split(":", 1)
3 >>>    print(role, end='')
4 >>>    print(" says: ", end='')
5 >>>    print(line_spoke, end='') 
NewSplit

这样发现还是有问题,因为 Pause行 和 End行 根本没法进行分割,这时有两种解决方案:

 1 # 方案一: 使用 each_line.find(":")来判断当前行中是否有分割符
 2 >>>for each_line in data:
 3 >>>    if not each_line.find(":") == -1:
 4 >>>        print(role, end='')
 5 >>>           print(" says: ", end='')
 6 >>>        print(line_spoke, end='')
 7 # 这个方案不强壮且可能需要经常变动。此时可以用到异常:
 8 # 方案二: 使用try except来处理,对于异常处理如果使用pass的话表示忽略这个异常继续执行:
 9 >>>for each_line in data:
10 >>>    try:
11 >>>        print(role, end='')
12 >>>           print(" says: ", end='')
13 >>>        print(line_spoke, end='')        
14 >>>    except:
15 >>>        pass 
Solutions

可以发现异常只需简单的处理就完成了想要的功能。接下来我们对异常进行具体化,假设要打开的文件不存在,在python中会抛出 IOError 。当然我们也可以通过 if os.path.exists(test3.txt) 来判断文件是否存在。
这里我们改进下异常处理代码,通过具化的异常捕获来实现:

 1 try:
 2     data = open('test3.txt')
 3     for each_line in data:
 4         (role, line_spoken) = each_line.split(":", 1)
 5         print(role, end='')
 6         print(" says: ", end='')
 7         print(line_spoken, end='')
 8 except ValueError:
 9     pass           # 表示忽略该异常,程序继续往下运行
10 except IOError:
11     print("File not exists!")
12 finally:
13     if 'data' in locals():                # 判断data变量是否存在当前区域内
14         print("Close file!")
15         data.close() 
SpecificExcept

 

保存数据到文件:
去掉字符串两端的空格,python有一个 strip函数,使用方式和java的trim一样。
python将数据写入文件大概包括下面三步:
1. 利用open函数打开文件进行写,open默认的打开方式是 "r",表示文件是用来打开读的,要用来写可以使用 out = open("test2.txt", "w") 。
2. 利用print函数的file参数,该参数默认是输出到标准控制台(sys.stdout ,可以引入sys来使用该变量),其实也可以指定文件。使用方式如下:
print("Hello", file = out)。
3. 一定要记得关闭文件输入流。
PS: 打开文件进行写的时候,如果文件不存在会自动创建,使用w模式会清空文件中的所有内容。如果想在原来文件内容上追加,可以使用a模式(如果又想读使用a+)。要打开一个文件用来读和写需要清除原来内容的话,使用w+。
修改前面的分别提取两人的代码,将两个人的说话内容分别写入不同的文件,总的代码如下:

 1 import os
 2 os.chdir('/home/zyq/KiDe/Python/test')
 3 man = []
 4 otherMan = []
 5 try:
 6     data = open('test2.txt')
 7     for each_line in data:
 8         (role, line_spoken) = each_line.split(":", 1)
 9         #print(role, end='')
10         # Store the message to array by the man
11         line_spoken = line_spoken.strip()
12         if role == 'Man':
13             man.append(line_spoken)
14         else:
15             otherMan.append(line_spoken)  
16         #print(" says: ", end='')
17         #print(line_spoken, end='')
18 except ValueError:
19     pass
20 except IOError:
21     print("File not exists!")
22 finally:                            # 必定会执行的
23     if 'data' in locals():      # 判断data变量是否存在,即是否打开了文件流
24         print("Close file test2.txt!")
25         data.close()
26  
27 #write two arrays to file
28 try:
29     out1 = open("man.txt", "w")
30     out2 = open("otherMan.txt", "w")
31     
32     print(man, file = out1)
33     print(otherMan, file = out2)
34 
35 except IOError:
36     print("File write error!")
37 finally:
38     out1.close()
39     print("Close file man.txt!")
40     out2.close()
41     print("Close file otherMan.txt!")  
Write

PS:在python中的字符串和java中一样也是不可变的。
上面这个程序还有以下改进点:
1. 具体的异常信息没有被输出, 这里可以对except块进行改进,改进后方式大致如下:
except IOError as err:
    print("File error:" + str(err))        # 一定要是用str函数将异常转换为字符串,否则会抛出类型不兼容错误
2. 对于上面打开的文件,都需要在finally块中将其关闭,其实python实现了jdk1.7之后才有的由编译器自动关闭的方式,通过with方式可以简单的实现该功能:
with open('test.txt', "w") as data
另外with支持同时打开多个文件,只需要用逗号隔开即可:
 with open('test.txt', "w") as data, open('test2.txt', "w") as data2
基于以上两点改进之后,新的代码如下:

 1 import os
 2 os.chdir('/home/zyq/KiDe/Python/test')
 3 man = []
 4 otherMan = []
 5 try:
 6     with open('test2.txt') as data:           # with打开的不需要显示的关闭
 7         for each_line in data:
 8             (role, line_spoken) = each_line.split(":", 1)
 9             # Store the message to array by the man
10             line_spoken = line_spoken.strip()
11             if role == 'Man':
12                 man.append(line_spoken)
13             else:
14                 otherMan.append(line_spoken)  
15 except ValueError:
16     pass
17 except IOError as err:
18     print("File read error:" + str(err))        # 输出具体异常信息
19  
20 #write two arrays to file
21 try:
22     with open("man.txt", "w") as out1, open("otherMan.txt", "w") as out2:
23         print(man, file = out1)
24         print(otherMan, file = out2)
25 except IOError as err:
26     print("File write error:" + str(err)) 
AutoClose

假设我现在想从文件中读出数据,直接使用readline可以发现文件中的所有内容都会被一股脑的输出出来,当然这时我们可以改进前面的print_list函数,使其增加一个输出到的位置参数 。使当时写入文件的列表数据按行来拆分。但是这样会导致函数的参数越来越多,使用更加复杂。所以这里我们使用另外一种方式: 引入pickle(腌制)包,并使用dump来写入数据,load来读出数据。此时需要注意写入和读出数据的时候模式应该用 "wb" 和 "rb",表示使用二进制的方式。使用pickle的时候可能抛出异常为PickleError,最终我们将代码改为:

 1 import os
 2 import pickle
 3 os.chdir('/home/zyq/KiDe/Python/test')
 4 man = []
 5 otherMan = []
 6 try:
 7     with open('test2.txt') as data:
 8         for each_line in data:
 9             (role, line_spoken) = each_line.split(":", 1)
10             # Store the message to array by the man
11             line_spoken = line_spoken.strip()
12             if role == 'Man':
13                 man.append(line_spoken)
14             else:
15                 otherMan.append(line_spoken)  
16 except ValueError:
17     pass
18 except IOError as err:
19     print("File read error:" + str(err))
20  
21 #write two arrays to file
22 try:
23     with open("man.txt", "wb") as out1, open("otherMan.txt", "wb") as out2:
24         pickle.dump(man, file = out1)
25         pickle.dump(otherMan, file = out2)
26 except IOError as err:
27     print("File write error:" + str(err))
28  
29 # 此时如果想读取man.txt文件中的信息的话,只需使用:
30 import pickle
31 with open('man.txt', 'rb') as data:
32     list = pickle.load(data)
33 # 此时list就是原来的列表。可以直接通过list[0]、list[1] 等来访问列表中的对应项。
Pickle

 

黎明前最黑暗,成功前最绝望!
相关文章
|
1月前
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
312 60
|
26天前
|
存储 索引 Python
|
1月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
13天前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
16 2
|
1月前
|
Linux 区块链 Python
Python实用记录(十三):python脚本打包exe文件并运行
这篇文章介绍了如何使用PyInstaller将Python脚本打包成可执行文件(exe),并提供了详细的步骤和注意事项。
51 1
Python实用记录(十三):python脚本打包exe文件并运行
|
26天前
|
Python
python读写操作excel日志
主要是读写操作,创建表格
53 2
|
27天前
|
Python
Python生成器、装饰器、异常
【10月更文挑战第15天】
|
29天前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
30天前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
|
1月前
|
JSON 数据格式 Python
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数
这篇文章介绍了一个Python脚本,用于统计TXT或JSON文件中特定单词的出现次数。它包含两个函数,分别处理文本和JSON文件,并通过命令行参数接收文件路径、目标单词和文件格式。文章还提供了代码逻辑的解释和示例用法。
42 0
Python实用记录(十四):python统计某个单词在TXT/JSON文件中出现的次数