文档备案控制台

开发者社区问答正文

使用python的urllib获取的网页源代码和在浏览器上查看的源代码不一样？

我发现使用python的urllib得到的网页源代码和直接在网页上查看的网页源代码有一些差别，直接查看源代码的方式看到的更加完整一些，例如某个href="http://www.baidu.com/ss/sd/12.jpg",但是通过urllib得到的源代码中只有：href="ss/12.jpg"或者干脆就是12.jpg，对此表示非常疑惑，哪位大神能够解释一下这是什么原因造成的？（urllib里面基本按照浏览器请求的头部来添加的头部字段）谢谢！

展开

收起

杨冬芳 2016-06-21 16:17:49 5051 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

杨冬芳

IT从业

同域下请求资源可省略协议甚至域名，因此所谓“不完整”的url都是合法的。
至于你看到的“完整”的url，都是浏览器为了更好的调试体验而加工过的。

2019-07-17 19:45:04

赞同展开评论

问答分类：

Python

问答标签：

Python网页浏览器python 浏览器网页 Python浏览器网页浏览器

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

如何使用Python playwright采集网页数据不被检测到？

945

2

0

手机钉钉上有在浏览器中打开网页的选项，用API如何调用？

402

1

0

如何在PC浏览器网页中嵌入视频会议？

433

1

0

我访问时，浏览器直接下载index.html文件了，没有打开网页是可以的么？

1276

1

0

modelscope-funasr的python服务端暂时还不支持网页访问吗？

206

0

0

钉钉接入企业内部应用，网页内容更新钉钉浏览器内容还是原来的这个缓存问题除了用户手动有什么办法解决？

215

1

0

钉钉接入企业内部应用，网页内容更新钉钉浏览器内容还是原来的吗？

269

1

0

钉钉浏览器网页内容更新访问还是原来的吗？

214

0

0

安装的win10，用实例edge浏览器访问网页打不开。所有的网页都打不开

217

1

0

python打印网页乱码怎么办

558

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

WordPress站点怎么进行速度优化？

阿里云CDN如何加速配置？

建立的网站被DDoS攻击怎么排查？

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

相关文章

OPC中国智能体如何降低幻觉：从 RAG 知识库到可追溯评测的工程实践

OPC中国智能体成本控制：从 Token 预算到可观测性的工程实践

外贸阀门站AI搜索复盘：从行业页到证据链

OMPS-NPP L1G LP 辐射度 EV 波长-高度网格条带轨道 3 缝 V2.6 (OMPS_NPP_LP_L1G_EV)

还有其他疑问?