文档备案控制台

开发者社区问答正文

python3.4.3 抓取网页的时候，网页中有一个乱码字符串，抓取出?报错

我的

@突然帅了你好，想跟你请教个问题：

我的是抓取网页遇到问题了：
python3.4.3
本来把网页转成utf-8没有问题，可是网页当中有一个一乱码，
徐�***** 结果一下子就报错了
：'utf-8' codec can't decode byte 0xe5 in position 10615: invalid continuation byte

我的代码：

result =  urllib.request.urlopen(url).read()  result == result.decode("utf-8")

如果没有第二行的话，不报错，但是结果是乱码

我搜了一下网页资料，看到你的文章了，但是还没有解决
求解一下

展开

收起

爱吃鱼的程序员 2020-06-12 15:29:31 578 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

这是因为在一个页面使用了不同的编码造成的。处理方法：1，直接过滤掉会乱码的部分然后解码。

2，对此部分使用不同的解码方式（不知道可以用chardet库检测），然后在连接起来。

2020-06-12 15:29:47

赞同展开评论

问答分类：

编解码

问答标签：

Python网页 Python字符串 Python抓取 Python报错 Python网页报错

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

如何使用Python playwright采集网页数据不被检测到？

966

2

0

modelscope-funasr的python服务端暂时还不支持网页访问吗？

213

0

0

AI Earth使用python版本的aie中循环用for跟map的区别跟gee的网页版的一样吗？

352

4

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1871

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

940

1

0

我在使用了Python的测试代码运行报错

684

1

0

flask程序引入numpy包報錯python版本3.9（本地3.9.8）， flask版本2.0.

1184

1

0

Python中字符串运算符r/R是什么意思?

947

1

0

Python中字符串运算符not in是什么意思?

664

1

0

Python中字符串运算符in是什么意思?

617

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

动态变量话术引擎对直播有什么作用？

新手如何进行OSS 图片处理 CDN 加速？

什么年代了，qoder cn还不支持多agent协同一起完成任务

qoder 资源包买完找不到记录也不知道再用，究竟是谁设计的，没见过这样的设计，

需要支持自定义Kimi k3 API

相关文章

【新版】阿里云 HappyHorse 功能介绍及配置价格表

公路表面裂缝目标检测数据集：1,500张图像 | 目标检测

精度再升级！无人机高光谱设备，搞定玉米全生育期长势监测

从模型 Demo 到剪辑产品：基于 MI-GAN、ONNX 与 WebGPU 实现浏览器本地视频去水印

OMI/Aura 臭氧(O3)总柱 1-轨道 L2 条带 13x24 公里 V003 (OMTO3)

还有其他疑问?