【python基础知识】16.“古诗默写题”的python实现(文件读写和编码-实操篇)

简介: 【python基础知识】16.“古诗默写题”的python实现(文件读写和编码-实操篇)

前言


回顾一下之前学到的编码和文件读写。


不同的编码方式:

1.png

编码和解码:2.png

读文件的三步骤:3.png

写文件的三步骤:4.png不同的读写方式:5.png

好了,复习到此结束,接下来一起来做项目吧!


练习介绍


练习目标


这个练习,会让你学会一种方法,可以直接修改原文件中的数据。


练习要求


语文老师将一些古诗存在txt文档里,一句一行。


最近,他计划抽一些古诗,自己设置一些空来让学生默写。


请你用代码帮老师完成这项工作(只要处理了一个文档,加上循环就能处理无数个文档了)。


项目实操


明确目标


我们以李商隐的《锦瑟》为例,这是原文档里的内容:

锦瑟
[唐] 李商隐
锦瑟无端五十弦,
一弦一柱思华年。
庄生晓梦迷蝴蝶,
望帝春心托杜鹃。
沧海月明珠有泪,
蓝田日暖玉生烟。
此情可待成追忆,
只是当时已惘然。

老师在这首诗想考学生“一弦一柱思华年。”和“只是当时已惘然。”,即他想得到的是:

锦瑟
[唐] 李商隐
锦瑟无端五十弦,
__。
庄生晓梦迷蝴蝶,
望帝春心托杜鹃。
沧海月明珠有泪,
蓝田日暖玉生烟。
此情可待成追忆,
__。

分析过程,拆解项目


准备工作


先新建一个poem1.txt,然后将以下古诗内容复制到里面,并且保存,放到与.py文件同目录下。

锦瑟
[唐] 李商隐
锦瑟无端五十弦,
一弦一柱思华年。
庄生晓梦迷蝴蝶,
望帝春心托杜鹃。
沧海月明珠有泪,
蓝田日暖玉生烟。
此情可待成追忆,
只是当时已惘然。

梳理思路


最终结果是要将“一弦一柱思华年。”和“只是当时已惘然。”这两句古诗用“__”来代替。


那首先我们就要能找到这两句古诗,所以思路如下:


1.找到poem1.txt文件


2.逐行读取该文件中的内容


3.逐行判断该行的内容是否是要找的两句古诗:“一弦一柱思华年。”和“只是当时已惘然。”如果是,就替换为“——”并写入poem2.txt文件,如果不是就原样写入test.txt文件.


代码实现,逐步执行


【第1步-开】


使用open()函数打开文件。

with open('poem1.txt', 'r', encoding='utf-8') as f:

open('poem1.txt', 'r', encoding='utf-8'):使用 open() 函数打开名为 poem1.txt 的文本文件。第一个参数是文件路径,第二个参数 'r' 表示以只读模式打开文件,第三个参数 'utf-8' 指定文件编码为 UTF-8。


with 语句:使用 with 打开文件,可以确保在操作完成后自动关闭文件,同时能够处理异常情况。

第2步-读】

lines = f.readlines()
print(lines)

f.readlines()使用文件对象 freadlines() 方法,读取所有行,并将它们存▪▪储在一个列表 lines中。


print(lines):打印读取到的内容,这里是文件的所有行。注意,输出的每一行都会带有换行符 \n


【第3步-文件写入&逻辑判断】

with open('test.txt', 'w', encoding='utf-8') as new:
    for line in lines:
        if line not in ['一弦一柱思华年。\n', '只是当时已惘然。\n']:
            new.write(line)
        else:
            new.write('____________\n')

open('test.txt', 'w', encoding='utf-8'):使用 open() 函数以写入模式打开名为 test.txt 的文件。第一个参数是文件路径,第二个参数 'w' 表示以写入模式打开文件(会覆盖原有内容),第三个参数 'utf-8' 指定文件编码为 UTF-8。


with 语句:使用 with 打开文件,确保在操作完成后自动关闭文件。


for line in lines::遍历 lines 列表中的每一行。


if line not in ['一弦一柱思华年。\n', '只是当时已惘然。\n']::检查当前行是否不等于给定的两行文本。


new.write(line):如果当前行不满足条件,则将其写入名为 new 的文件中。


else::如果当前行满足条件,则将 '____________\n' 写入文件中。


【第4步-关】


由于使用 with 打开文件,在操作完成后会自动关闭文件。无需再专门写关闭的代码。


完整代码:

with open ('poem1.txt','r',encoding='utf-8') as f:
    lines = f.readlines()  # 这时,lines 的数据存放在内存里。
print(lines)  # 将读取到的内容打印出来,发现实际上读到的是带换行符的字符串。
with open('test.txt','w',encoding='utf-8') as new:
    for line in lines:  # 在内存中,对数据进行处理,然后再写到文档里,覆盖之前的内容。
        if line not in ['一弦一柱思华年。\n','只是当时已惘然。\n']:  # 注意:这里的条件要根据上面打印出的数据写。
            new.write(line)
        else:
            new.write('____________\n')

这段代码的功能是将 poem1.txt 中的内容读取到内存中,进行处理后,再覆盖写入到 test.txt 文件中。具体处理方式是,如果某一行与给定的两行文本相等,则在 test.txt 中写入 '____________\n',否则直接将原始行写入 test.txt


另一种写法:


也可以将目标语句放到一个list中,在判断的时候,如果属于这个list,就替换为“____________”


代码如下:

list_test = ['一弦一柱思华年。\n','只是当时已惘然。\n']  # 将要默写的诗句放在列表里。
with open ('poem1.txt','r') as f:
    lines = f.readlines()
print(lines)
with open('test.txt','w') as new:
    for line in lines:
        if line in list_test:  # 属于默写列表中的句子,将其替换成横线。
            new.write('____________。\n')
        else:
            new.write(line)

总结


通过这个项目的实操,我们掌握并巩固了以下几个知识点:


1.文件操作:学习如何使用 Python 进行文件的读写操作。通过 open() 函数打开文件,使用 'r' 模式进行读取,使用 'w' 模式进行写入。


2.上下文管理器:学习如何使用 with 语句来打开文件。with 语句可以确保在操作完成后自动关闭文件,同时能够处理异常情况,提高代码的健壮性。


3.读取文件内容:学习使用 readlines() 方法从文件对象中读取所有行,并将其存储在一个列表中。这样可以方便地对文件内容进行处理和操作。


4.字符串比较和处理:学习如何对读取到的文本字符串进行条件判断和处理。在示例代码中,通过判断是否与给定两行文本相等,来决定是否写入 '____________\n' 或原始行到目标文件。


5.文件编码设置:学习如何设置文件的编码。示例中使用了 'utf-8' 编码,确保正确读取和写入包含非英文字符的文本。


通过理解和应用这些知识点,可以更好地处理和操作文本文件,扩展其对文件操作的基础能力。


总结为表格:


下面是使用 Markdown 格式总结这段代码可以学到的知识的表格:

知识点

描述

文件操作

学习如何使用 Python 进行文件的读写操作

上下文管理器

学习如何使用 with 语句来打开文件,自动关闭文件,并处理异常情况

读取文件内容

学习使用 readlines() 方法从文件对象中读取所有行,并存储在列表中
字符串比较处理 学习如何对读取到的文本字符串进行条件判断和处理
文件编码设置 学习如何设置文件的编码,以确保正确读取和写入包含非英文字符的文本

本节完美结束,撒花~希望大家多多练习,早日成为大神!

相关文章
|
7月前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
2月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
2月前
|
编译器 Python
如何利用Python批量重命名文件
本文介绍了如何使用Python和PyCharm对文件进行批量重命名,包括文件名前后互换、按特定字符调整顺序等实用技巧,并提供了完整代码示例。同时推荐了第三方工具Bulk Rename Utility,便于无需编程实现高效重命名。适用于需要处理大量文件命名的场景,提升工作效率。
|
3月前
|
编解码 Prometheus Java
当Python同时操作1000个文件时,为什么你的CPU只用了10%?
本文介绍如何构建一个高效的文件处理系统,解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合,实现任务调度优化,提升I/O密集型操作的性能。
65 4
|
3月前
|
人工智能 索引 Python
[oeasy]python094_使用python控制音符列表_midi_文件制作
本文介绍了如何使用Python控制音符列表制作MIDI文件。首先回顾了列表下标索引(正数和负数)的用法,接着通过`mido`库实现MIDI文件生成。以《两只老虎》为例,详细解析了代码逻辑:定义音高映射、构建旋律列表、创建MIDI文件框架,并将音符插入音轨。还探讨了音符时值与八度扩展的实现方法。最终生成的MIDI文件可通过不同平台播放或编辑。总结中提到,此技术可用于随机生成符合调性的旋律,同时引发对列表其他实际应用的思考。
95 5
|
2月前
|
数据采集 监控 算法
Python文件与目录比较全攻略:从基础操作到性能优化
文件比较的核心在于数据指纹校验,通过逐字节比对生成唯一标识,确保内容一致性。从标准库的os与filecmp到高性能第三方库如pydiffx,再到分布式与量子加密技术的未来趋势,文件比较广泛应用于数据备份、代码审查与系统监控等领域,是保障数据完整性的关键技术手段。
75 0
|
5月前
|
Python
使用Python实现multipart/form-data文件接收的http服务器
至此,使用Python实现一个可以接收 'multipart/form-data' 文件的HTTP服务器的步骤就讲解完毕了。希望通过我的讲解,你可以更好地理解其中的逻辑,另外,你也可以尝试在实际项目中运用这方面的知识。
252 69
|
3月前
|
数据采集 存储 API
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件
|
3月前
|
数据采集 运维 BI
Python 文件操作进阶|使用 shutil 实现高效文件复制
在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!
|
5月前
|
Shell 开发者 Docker
Python文件打包:一站式指南
本文深入探讨Python文件打包的各种方法,从基础的zip和tar工具到高级的setuptools、PyInstaller、cx_Freeze等,涵盖Docker镜像、虚拟环境及自包含可执行文件的打包方式。通过示例代码与详细解析,帮助开发者根据项目需求选择合适的打包方案,提升代码分发与部署效率。内容全面,适合各水平读者学习参考。
414 7

热门文章

最新文章

推荐镜像

更多