url = "http://www.douban.com/"
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
print(data)
先上代码,网上的教程大多是python2的,我直接安装的是3.5,上述代码输出,
中文字符集不对,ad\x97\xe2\x80\x94\xe2\x80\x94\xe9\xbe\x99\xe7\x8c\xab\xe4\xb9\x90\xe9\x98\x9f\xe5\x8a\xa8\xe6\xbc\xab\xe9\x92\xa2\xe7\x90\xb4\xe6\xb5\xaa\xe6\xbc\xab\xe8\xa7\x86\xe5\x90\xac\xe6\x96\xb0\xe5\xb9\xb4\xe9\x9f\xb3\xe4\xb9\x90\xe4\xbc\x9a">\n \xe4\xbd\xa0\xe7\x9a\x84\xe5\x90\x8d\xe5\xad\x97\xe2\x80\
像这样
最后一句改成这样
print(data.decode('utf-8'))
有这样的报错
UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 43596: illegal multibyte sequence
求助,怎么解决?我看到关于python3的教程 他们输出都是正常的
改成gb2312试试
importurllib.requesturl="http://www.douban.com/"request=urllib.request.Request(url)response=urllib.request.urlopen(request)data=response.read()print(data.decode('utf-8'))
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。