data = urllib.request.urlopen(url).read()
print(data)
data = data.decode('GBK')
print(data)
报错内容:Traceback (most recent call last):
File "C:\Users\root\Desktop\worker7\worker.py", line 79, in <module>UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 3169: illegal multibyte sequence
不知道这个是什么错误,就是把网页转换成gbk时候,报错,抓取其他网页都是好好的
data=data.decode('GBK','ignore')
因为有些字符可能不在GBK里面,所以无法转换,忽略掉就好了。
谢谢版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。