使用python的urllib获取的网页源代码和在浏览器上查看的源代码不一样?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

使用python的urllib获取的网页源代码和在浏览器上查看的源代码不一样?

杨冬芳 2016-06-21 16:17:49 2308

我发现使用python的urllib得到的网页源代码和直接在网页上查看的网页源代码有一些差别,直接查看源代码的方式看到的更加完整一些,例如某个href="http://www.baidu.com/ss/sd/12.jpg",但是通过urllib得到的源代码中只有:href="ss/12.jpg"或者干脆就是12.jpg,对此表示非常疑惑,哪位大神能够解释一下这是什么原因造成的?(urllib里面基本按照浏览器请求的头部来添加的头部字段)谢谢!

Python
分享到
取消 提交回答
全部回答(1)
  • 杨冬芳
    2019-07-17 19:45:04

    同域下请求资源可省略协议甚至域名,因此所谓“不完整”的url都是合法的。

    至于你看到的“完整”的url,都是浏览器为了更好的调试体验而加工过的。

    0 0
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

推荐文章
相似问题
推荐课程