备案控制台

开发者社区问答正文

如何从python中的两个不同文件中删除重复文本

我的问题：我有两个文件，“ text1.txt”和“ text2.txt”

“ Text1.txt”包含以下内容：

Banana, rotten
Apple, ripe
Cheese, fresh

“ Text2.txt”包含以下内容：

Banana, good
Dragon, edible
Cheese, nice

我要创建的代码将使用text1.txt检查text2.txt并删除单词和在逗号前重复其自身的整个行。因此，在这种情况下，它看起来像这样：“ Text1.txt”更改为，而Text2.txt将保持不变

Apple, ripe

我设法做的是检查这些单词是否是重复的，没有逗号，但是甚至很难做到这一点。我的尝试如下：

New_food = open("text1.txt", "r+")
All_food = open("text2.txt")
food = New_food.readlines()
food2 = All_food.readlines()

#The following calculates how many lines the text file has
def file_len(fname):
    with open(fname) as s:
        for t, l in enumerate(s):
            pass
    return t+1

#calculates line number
n = file_len("text1.txt")
m = file_len("text2.txt")

for g in range(n):
    food_r = food[g]
    for j in range(m):
        food2_r = food2[j]
        if food_r == food2_r:
            print(5) #only when they match

我已经使用以下代码在换行符到达逗号之前进行了换行：

word = "cheese , fresh"
type_, \*als = word.split(',')
print(type_) #this would return cheese

问题来源：stackoverflow

展开

收起

is大龙 2020-03-23 20:21:52 768 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

天枢2020

代码改变世界，我们改变代码

两个文件夹遍历不就好了吗。

2020-03-24 10:09:56

赞同展开评论

问答分类：

Python

问答标签：

Python文本 Python文件 Python重复 Python删除

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

有没有 python 调用自然语言处理sdk 中的文本纠错功能的代码示例

247

5

0

阿里语音AI的“实时长文本”语音合成服务的流逝返回，有python的sdk吗？

145

1

0

有什么办法可以批量获得线上这些文件信息嘛？用python可以吗？

630

1

0

python能否不选中资源，直接使用dolphinscheduler的资源中心文件

860

0

0

自定义python processor 通过 urlopen 方式调用 oss存储的文件报错 <

1195

1

0

python可使用 to_csv() 将 dataframe 存储为 csv 文件吗？

827

0

0

python文件如何在dataworks中封装成自定义函数使用

800

1

0

想问一下，python自定义组件中上层OSS读数据的输入，为啥会报文件不存在啊

661

0

0

Python 数据挖掘中，文本相似度计算方法中的其他方法又有哪些呢？

2899

1

0

Python 数据挖掘中，文本相似度计算里的本体是什么意思呢？

2882

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

减速机行业场景化技术方案与数据化选型指南

使用 Cursor 进行自动代码调试的实用指南

基于 YOLOv8 的智能车牌定位检测系统设计与实现—从模型训练到 PyQt 可视化落地的完整实战方案

蓝易云：Python游戏开发：使用Pygame库的全面教程

NPP 热带森林：马来西亚姆鲁山，1977-1978 年，R1

还有其他疑问?