python解决处理中文的问题-阿里云开发者社区

开发者社区> 人工智能> 正文

python解决处理中文的问题

简介:

阅读目录

回到顶部

脚本开头添加默认编码

python源码中出现了中文字符或要处理中文字符,运行时会出现错误,解决方法是,开头加入字符编码声明:

1
2
#! /usr/bin/env python
# -*- coding:utf-8 -*-

 处理时可能会出现问题:

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-15: ordinal not in range(128)

这需要在开始位置加入代码

1
2
3
import sys
reload(sys)
sys.setdefaultencoding('utf8')

 比如读入一行中文代码,要写入另一个文件时,需要解码与编码的变换:

1
2
= "我在博客园“
w.write(p.decode('utf-8').encode('utf-8'+ '\n')
回到顶部

csv中文编码乱码

往文件中如果存储方式是utf-8,打开csv文件时就是乱码,如果考出来重新存储为gbk格式就可以正常显示了。但是可以存储的时候就直接存储为gb2312

#! coding:utf-8
f = file('ss.csv', 'w')
f.write('你好'.decode('utf-8').encode('gb2312'))
f.close()

这样用excel打开就不是乱码。



本文转自jihite博客园博客,原文链接:http://www.cnblogs.com/kaituorensheng/p/3375075.html,如需转载请自行联系原作者


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章