开发者社区> 问答> 正文

如何在python中处理重音字符?

我知道这里有很多资料,但是我无法解决我的问题。

我将此文本写在我必须操纵的txt文件中,并且其中包含许多重音字符。由于某些原因,我无法正确管理它们。这是我的代码:

file = open ('parsed.txt', 'w', encoding = 'latin1')
file.write('ààààà')

这很好。

但我也需要使这项工作正常进行:

with open('input.txt', 'r', encoding = 'latin1') as f:
    string = f.read()
    or_array = string.splitlines()
    new_array = []
    for line in or_array:
        new = (line[13:]).strip()
        print(new)
        new_array.append(new)
    new_string = ''
    for lin in new_array:
        new_string += lin
        new_string += ' '
    f_n = open('parsed.txt', 'w', encoding = 'latin1')
    f_n.write(new_string)

该代码有什么问题?

输入:

00:00:06.49    ciaò
00:00:20.665     Questa è una provà
00:00:44.157     èè   aa ò à ùù ù
00:00:44.157       

输出:

ciaò Questa è una provàèè   aa ò à ùù ù  

谢谢。

问题来源:stackoverflow

展开
收起
is大龙 2020-03-23 20:26:00 362 0
1 条回答
写回答
取消 提交回答
  • 如果input.txt的内容实际上在ISO-8859-1中,则对我有用。如果使用UTF-8,则会得到不正确的结果。换句话说,当我复制/粘贴您的输入时,我得到的文件的内容为UTF-8。如果我执行iconv -f utf-8 -t L1 <utf8.txt> input.txt,那么您的程序可以正常工作。

    顺便说一句,您的程序不是惯用的python,在大型输入时效率很低。

    回答来源:stackoverflow

    2020-03-23 20:26:04
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载