开发者社区问答正文

如何在python中处理重音字符？

我知道这里有很多资料，但是我无法解决我的问题。

我将此文本写在我必须操纵的txt文件中，并且其中包含许多重音字符。由于某些原因，我无法正确管理它们。这是我的代码：

file = open ('parsed.txt', 'w', encoding = 'latin1')
file.write('ààààà')

这很好。

但我也需要使这项工作正常进行：

with open('input.txt', 'r', encoding = 'latin1') as f:
    string = f.read()
    or_array = string.splitlines()
    new_array = []
    for line in or_array:
        new = (line[13:]).strip()
        print(new)
        new_array.append(new)
    new_string = ''
    for lin in new_array:
        new_string += lin
        new_string += ' '
    f_n = open('parsed.txt', 'w', encoding = 'latin1')
    f_n.write(new_string)

该代码有什么问题？

输入：

00:00:06.49    ciaò
00:00:20.665     Questa è una provà
00:00:44.157     èè   aa ò à ùù ù
00:00:44.157

输出：

ciaò Questa è una provàèè   aa ò à ùù ù

谢谢。

问题来源：stackoverflow

展开

收起

is大龙 2020-03-23 20:26:00 422 版权

1 条回答

写回答

取消提交回答

is大龙

如果input.txt的内容实际上在ISO-8859-1中，则对我有用。如果使用UTF-8，则会得到不正确的结果。换句话说，当我复制/粘贴您的输入时，我得到的文件的内容为UTF-8。如果我执行iconv -f utf-8 -t L1 <utf8.txt> input.txt，那么您的程序可以正常工作。

顺便说一句，您的程序不是惯用的python，在大型输入时效率很低。

回答来源：stackoverflow

2020-03-23 20:26:04

赞同展开评论

问答分类：

Python

问答标签：

Python字符

问答地址：

开发者社区 > 开发与运维 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

如何在python中处理重音字符？

相关文章