开发者社区> 问答> 正文

如何从python中的两个不同文件中删除重复文本

我的问题:我有两个文件,“ text1.txt”和“ text2.txt”

“ Text1.txt”包含以下内容:

Banana, rotten
Apple, ripe
Cheese, fresh

“ Text2.txt”包含以下内容:

Banana, good
Dragon, edible
Cheese, nice

我要创建的代码将使用text1.txt检查text2.txt并删除单词和在逗号前重复其自身的整个行。因此,在这种情况下,它看起来像这样:“ Text1.txt”更改为,而Text2.txt将保持不变

Apple, ripe

我设法做的是检查这些单词是否是重复的,没有逗号,但是甚至很难做到这一点。我的尝试如下:

New_food = open("text1.txt", "r+")
All_food = open("text2.txt")
food = New_food.readlines()
food2 = All_food.readlines()

#The following calculates how many lines the text file has
def file_len(fname):
    with open(fname) as s:
        for t, l in enumerate(s):
            pass
    return t+1

#calculates line number
n = file_len("text1.txt")
m = file_len("text2.txt")

for g in range(n):
    food_r = food[g]
    for j in range(m):
        food2_r = food2[j]
        if food_r == food2_r:
            print(5) #only when they match

我已经使用以下代码在换行符到达逗号之前进行了换行:

word = "cheese , fresh"
type_, \*als = word.split(',')
print(type_) #this would return cheese

问题来源:stackoverflow

展开
收起
is大龙 2020-03-23 20:21:52 725 0
1 条回答
写回答
取消 提交回答
  • 代码改变世界,我们改变代码

    两个文件夹遍历不就好了吗。

    2020-03-24 10:09:56
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载