开发者社区> 问答> 正文

求助 刚学python 学习爬虫?报错

url = "http://www.douban.com/"
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
print(data)
先上代码,网上的教程大多是python2的,我直接安装的是3.5,上述代码输出,
中文字符集不对,ad\x97\xe2\x80\x94\xe2\x80\x94\xe9\xbe\x99\xe7\x8c\xab\xe4\xb9\x90\xe9\x98\x9f\xe5\x8a\xa8\xe6\xbc\xab\xe9\x92\xa2\xe7\x90\xb4\xe6\xb5\xaa\xe6\xbc\xab\xe8\xa7\x86\xe5\x90\xac\xe6\x96\xb0\xe5\xb9\xb4\xe9\x9f\xb3\xe4\xb9\x90\xe4\xbc\x9a">\n \xe4\xbd\xa0\xe7\x9a\x84\xe5\x90\x8d\xe5\xad\x97\xe2\x80\
像这样
最后一句改成这样
print(data.decode('utf-8'))
有这样的报错
UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 43596: illegal multibyte sequence
求助,怎么解决?我看到关于python3的教程 他们输出都是正常的

展开
收起
爱吃鱼的程序员 2020-06-07 22:09:21 875 0
1 条回答
写回答
取消 提交回答
  • https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

    改成gb2312试试

    importurllib.requesturl="http://www.douban.com/"request=urllib.request.Request(url)response=urllib.request.urlopen(request)data=response.read()print(data.decode('utf-8'))

     

    2020-06-07 22:09:36
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载