文档备案控制台

开发者社区问答正文

Python使用正则对字符串切片后乱码的问题? 400 报错

Python使用正则对字符串切片后乱码的问题? 400 报错

对字符串'你^好^吖'进行切分，以"^"未分隔符。

代码如下：

#!/bin/bash/python
# coding=utf-8
import sys
import re

print sys.getdefaultencoding()
str='你^好^吖'
ss=re.split('\^',str)
print ss[0]
print ss

对于print ss ，显示的内容是['\xe4\xbd\xa0', '\xe5\xa5\xbd', '\xe5\x90\x96']，请问该怎么解决呢？

[ypchen@localhost python]$ python code.py
ascii
你
['\xe4\xbd\xa0', '\xe5\xa5\xbd', '\xe5\x90\x96']

展开

收起

爱吃鱼的程序员 2020-06-01 11:02:42 623 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB
flags 参数使用 re.UNICODE试试

如果不行，就只能把结果在decode了
######
应该是编码问题，看我的utf-8
```
'''
Created on 2011-11-8

@author: dudong0726
'''
import sys
import re

if __name__ == '__main__':  
    print(sys.getdefaultencoding())
    str='你^好^吖'
    ss=re.split('\^',str)
    print(ss[0])
    print(ss)
```
结果：
```
utf-8
你
['你', '好', '吖']
```
######你好，你是修改了python默认的编码方式？使用sys.setdefaultencoding('utf-8')这个语句？######
如果是 python 2.7 可以用这个来改默认编码（在 Windows 下的 IDLE 中无效，要在普通 py 脚本或者 Python CLI 中测试）：
```
#-*- coding:utf-8 -*-
from __future__ import unicode_literals
print(type("test")) # output: <type 'unicode'>
spam = "测试字符串"
print(spam[1:3]) # output:试字
```
其实就是提前引入 Python 3.x 的默认 unicode 特性

如果只是少部分使用，那么使用 unicode 格式字符串就好：
```
>>> u"测试"
u'\u6d4b\u8bd5'
>>> "测试"
'\xb2\xe2\xca\xd4'
>>>
```
###### @司徒春运 : 那可以用第二种方法，在每个字符串前面加 u 吧######[ypchen@localhost python]$ python -V Python 2.6.5 。。。######
#!/bin/bash/python # coding=utf-8 import sys import re print sys.getdefaultencoding() default_encoding = 'utf-8' if sys.getdefaultencoding() != default_encoding: reload(sys) sys.setdefaultencoding(default_encoding) print sys.getdefaultencoding() str='你^好^吖' print type(str) ss=re.split('\^',str) print(ss)
结果：
ascii utf-8 <type 'str'> ['\xe4\xbd\xa0', '\xe5\xa5\xbd', '\xe5\x90\x96']
######我遇到了相同的问题，楼主解决没？######我也是。有没有阶解决了？
2020-06-01 11:02:44

赞同展开评论

问答分类：

Shell Python

问答标签：

Python切片 Python字符串 Python报错 Python字符串切片 Python正则

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

在ModelScope中，用python sdk下载的数据集文件名称全是乱码？

614

3

0

想要匹配出类似重庆时时彩开奖数据抓取的数据，这个正则要怎么写呢？

129

1

0

用python上传本地的pdf和word的文件，pdf上传后打开为乱码，如何上传

514

2

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1854

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

926

1

0

我在使用了Python的测试代码运行报错

669

1

0

flask程序引入numpy包報錯python版本3.9（本地3.9.8）， flask版本2.0.

1169

1

0

maxcomputer使用key通过 python下载数据列中文内容每次都是乱码需要解析，怎么解决？

837

1

0

python3节点调用阿里云sdk提示模块未找到报错，请问下这是什么原因，路径问题吗？

933

1

0

自定义python processor 通过 urlopen 方式调用 oss存储的文件报错 <

1295

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

什么时候对齐国际版的功能啊？现在毫无使用欲望

Quest无法打开远程服务器中的项目

历史会话更新遗失

qoder是不是只能土豪使用吧？

qoder cn 个人专业版的credit用完了，怎么增加credit呢

相关文章

Claude Code、Codex跑命令前，先复制这张安全表

Claude Code 转向 Codex 实战指南：12 项关键配置与 1 个踩坑记录

WhatsApp 用户名功能衍生社交钓鱼风险及闭环防御技术研究

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

还有其他疑问?