文档备案控制台

开发者社区问答正文

使用python的urllib获取的网页源代码和在浏览器上查看的源代码不一样？

我发现使用python的urllib得到的网页源代码和直接在网页上查看的网页源代码有一些差别，直接查看源代码的方式看到的更加完整一些，例如某个href="http://www.baidu.com/ss/sd/12.jpg",但是通过urllib得到的源代码中只有：href="ss/12.jpg"或者干脆就是12.jpg，对此表示非常疑惑，哪位大神能够解释一下这是什么原因造成的？（urllib里面基本按照浏览器请求的头部来添加的头部字段）谢谢！

展开

收起

杨冬芳 2016-06-21 16:17:49 4956 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

杨冬芳

IT从业

同域下请求资源可省略协议甚至域名，因此所谓“不完整”的url都是合法的。
至于你看到的“完整”的url，都是浏览器为了更好的调试体验而加工过的。

2019-07-17 19:45:04

赞同展开评论

问答分类：

Python

问答标签：

Python网页浏览器python 浏览器网页 Python浏览器网页浏览器

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

如何使用Python playwright采集网页数据不被检测到？

283

2

0

手机钉钉上有在浏览器中打开网页的选项，用API如何调用？

335

1

0

如何在PC浏览器网页中嵌入视频会议？

310

1

0

我访问时，浏览器直接下载index.html文件了，没有打开网页是可以的么？

971

1

0

modelscope-funasr的python服务端暂时还不支持网页访问吗？

135

0

0

钉钉接入企业内部应用，网页内容更新钉钉浏览器内容还是原来的这个缓存问题除了用户手动有什么办法解决？

158

1

0

钉钉接入企业内部应用，网页内容更新钉钉浏览器内容还是原来的吗？

172

1

0

钉钉浏览器网页内容更新访问还是原来的吗？

133

0

0

安装的win10，用实例edge浏览器访问网页打不开。所有的网页都打不开

152

1

0

怎么查看python是多少位方

624

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

OpenClaw Gateway Token 获取？

阿里云千问Token价格怎么收费？

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

相关文章

别只会 `model.fit()`：聊聊 TensorFlow 2.x 的性能优化与生产部署那些事

龙虾AI怎么养？OpenClaw一键部署，两步解锁专属龙虾AI助理！

针对AWS云环境的AiTM钓鱼攻击机制与防御架构研究

OpenClaw（养龙虾）+ 钉钉对接：保姆级全链路操作指南

新手必看：Python剔除超时代理IP的简单方法，一步到位

还有其他疑问?