前言
回顾一下之前学到的编码和文件读写。
不同的编码方式:
编码和解码:
读文件的三步骤:
写文件的三步骤:不同的读写方式:
好了,复习到此结束,接下来一起来做项目吧!
练习介绍
练习目标
这个练习,会让你学会一种方法,可以直接修改原文件中的数据。
练习要求
语文老师将一些古诗存在txt文档里,一句一行。
最近,他计划抽一些古诗,自己设置一些空来让学生默写。
请你用代码帮老师完成这项工作(只要处理了一个文档,加上循环就能处理无数个文档了)。
项目实操
明确目标
我们以李商隐的《锦瑟》为例,这是原文档里的内容:
锦瑟 [唐] 李商隐 锦瑟无端五十弦, 一弦一柱思华年。 庄生晓梦迷蝴蝶, 望帝春心托杜鹃。 沧海月明珠有泪, 蓝田日暖玉生烟。 此情可待成追忆, 只是当时已惘然。
老师在这首诗想考学生“一弦一柱思华年。”和“只是当时已惘然。”,即他想得到的是:
锦瑟 [唐] 李商隐 锦瑟无端五十弦, __。 庄生晓梦迷蝴蝶, 望帝春心托杜鹃。 沧海月明珠有泪, 蓝田日暖玉生烟。 此情可待成追忆, __。
分析过程,拆解项目
准备工作
先新建一个poem1.txt,然后将以下古诗内容复制到里面,并且保存,放到与.py文件同目录下。
锦瑟 [唐] 李商隐 锦瑟无端五十弦, 一弦一柱思华年。 庄生晓梦迷蝴蝶, 望帝春心托杜鹃。 沧海月明珠有泪, 蓝田日暖玉生烟。 此情可待成追忆, 只是当时已惘然。
梳理思路
最终结果是要将“一弦一柱思华年。”和“只是当时已惘然。”这两句古诗用“__”来代替。
那首先我们就要能找到这两句古诗,所以思路如下:
1.找到poem1.txt文件
2.逐行读取该文件中的内容
3.逐行判断该行的内容是否是要找的两句古诗:“一弦一柱思华年。”和“只是当时已惘然。”如果是,就替换为“——”并写入poem2.txt文件,如果不是就原样写入test.txt文件.
代码实现,逐步执行
【第1步-开】
使用open()函数打开文件。
with open('poem1.txt', 'r', encoding='utf-8') as f:
▪open('poem1.txt', 'r', encoding='utf-8'):使用 open() 函数打开名为 poem1.txt 的文本文件。第一个参数是文件路径,第二个参数 'r' 表示以只读模式打开文件,第三个参数 'utf-8' 指定文件编码为 UTF-8。
▪with 语句:使用 with 打开文件,可以确保在操作完成后自动关闭文件,同时能够处理异常情况。
【第2步-读】
lines = f.readlines() print(lines)
▪f.readlines()
:使用文件对象 f
的 readlines()
方法,读取所有行,并将它们存▪▪储在一个列表 lines
中。
▪print(lines)
:打印读取到的内容,这里是文件的所有行。注意,输出的每一行都会带有换行符 \n
。
【第3步-文件写入&逻辑判断】
with open('test.txt', 'w', encoding='utf-8') as new: for line in lines: if line not in ['一弦一柱思华年。\n', '只是当时已惘然。\n']: new.write(line) else: new.write('____________\n')
▪open('test.txt', 'w', encoding='utf-8'):使用 open() 函数以写入模式打开名为 test.txt 的文件。第一个参数是文件路径,第二个参数 'w' 表示以写入模式打开文件(会覆盖原有内容),第三个参数 'utf-8' 指定文件编码为 UTF-8。
▪with 语句:使用 with 打开文件,确保在操作完成后自动关闭文件。
▪for line in lines::遍历 lines 列表中的每一行。
▪if line not in ['一弦一柱思华年。\n', '只是当时已惘然。\n']::检查当前行是否不等于给定的两行文本。
▪new.write(line):如果当前行不满足条件,则将其写入名为 new 的文件中。
▪else::如果当前行满足条件,则将 '____________\n' 写入文件中。
【第4步-关】
由于使用 with 打开文件,在操作完成后会自动关闭文件。无需再专门写关闭的代码。
完整代码:
with open ('poem1.txt','r',encoding='utf-8') as f: lines = f.readlines() # 这时,lines 的数据存放在内存里。 print(lines) # 将读取到的内容打印出来,发现实际上读到的是带换行符的字符串。 with open('test.txt','w',encoding='utf-8') as new: for line in lines: # 在内存中,对数据进行处理,然后再写到文档里,覆盖之前的内容。 if line not in ['一弦一柱思华年。\n','只是当时已惘然。\n']: # 注意:这里的条件要根据上面打印出的数据写。 new.write(line) else: new.write('____________\n')
这段代码的功能是将 poem1.txt 中的内容读取到内存中,进行处理后,再覆盖写入到 test.txt 文件中。具体处理方式是,如果某一行与给定的两行文本相等,则在 test.txt 中写入 '____________\n',否则直接将原始行写入 test.txt。
另一种写法:
也可以将目标语句放到一个list中,在判断的时候,如果属于这个list,就替换为“____________”
代码如下:
list_test = ['一弦一柱思华年。\n','只是当时已惘然。\n'] # 将要默写的诗句放在列表里。 with open ('poem1.txt','r') as f: lines = f.readlines() print(lines) with open('test.txt','w') as new: for line in lines: if line in list_test: # 属于默写列表中的句子,将其替换成横线。 new.write('____________。\n') else: new.write(line)
总结
通过这个项目的实操,我们掌握并巩固了以下几个知识点:
1.文件操作:学习如何使用 Python 进行文件的读写操作。通过 open() 函数打开文件,使用 'r' 模式进行读取,使用 'w' 模式进行写入。
2.上下文管理器:学习如何使用 with 语句来打开文件。with 语句可以确保在操作完成后自动关闭文件,同时能够处理异常情况,提高代码的健壮性。
3.读取文件内容:学习使用 readlines() 方法从文件对象中读取所有行,并将其存储在一个列表中。这样可以方便地对文件内容进行处理和操作。
4.字符串比较和处理:学习如何对读取到的文本字符串进行条件判断和处理。在示例代码中,通过判断是否与给定两行文本相等,来决定是否写入 '____________\n' 或原始行到目标文件。
5.文件编码设置:学习如何设置文件的编码。示例中使用了 'utf-8' 编码,确保正确读取和写入包含非英文字符的文本。
通过理解和应用这些知识点,可以更好地处理和操作文本文件,扩展其对文件操作的基础能力。
总结为表格:
下面是使用 Markdown 格式总结这段代码可以学到的知识的表格:
知识点 |
描述 |
文件操作 |
学习如何使用 Python 进行文件的读写操作 |
上下文管理器 |
学习如何使用 with 语句来打开文件,自动关闭文件,并处理异常情况 |
读取文件内容 |
学习使用 readlines() 方法从文件对象中读取所有行,并存储在列表中 |
字符串比较处理 | 学习如何对读取到的文本字符串进行条件判断和处理 |
文件编码设置 | 学习如何设置文件的编码,以确保正确读取和写入包含非英文字符的文本 |
本节完美结束,撒花~希望大家多多练习,早日成为大神!