我发现使用python的urllib得到的网页源代码和直接在网页上查看的网页源代码有一些差别,直接查看源代码的方式看到的更加完整一些,例如某个href="http://www.baidu.com/ss/sd/12.jpg",但是通过urllib得到的源代码中只有:href="ss/12.jpg"或者干脆就是12.jpg,对此表示非常疑惑,哪位大神能够解释一下这是什么原因造成的?(urllib里面基本按照浏览器请求的头部来添加的头部字段)谢谢!
同域下请求资源可省略协议甚至域名,因此所谓“不完整”的url都是合法的。
至于你看到的“完整”的url,都是浏览器为了更好的调试体验而加工过的。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。