开发者社区> 问答> 正文

python爬取网页时候遇到UnicodeDecodeError的错误?报错


data = urllib.request.urlopen(url).read()   

print(data)

data = data.decode('GBK')
print(data)

报错内容:Traceback (most recent call last):

  File "C:\Users\root\Desktop\worker7\worker.py", line 79, in <module>
    print(getvillageinfo(bbb[1248]))
  File "C:\Users\root\Desktop\worker7\worker.py", line 26, in getvillageinfo
    data = data.decode('gbk')

UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 3169: illegal multibyte sequence

不知道这个是什么错误,就是把网页转换成gbk时候,报错,抓取其他网页都是好好的

展开
收起
爱吃鱼的程序员 2020-06-10 10:45:39 473 0
1 条回答
写回答
取消 提交回答
  • https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

    data=data.decode('GBK','ignore')

    因为有些字符可能不在GBK里面,所以无法转换,忽略掉就好了。

    谢谢
    2020-06-10 10:45:56
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载