开发者社区> 问答> 正文

python爬虫,爬出来和源码不同怎么处理?

已解决

爬某网站,爬不到有效内容,这是为什么,怎么才能爬到具体的帖子内容?(附图是用下面的代码爬下来的内容)

image.png

image.png

展开
收起
我是小美女 2021-10-19 20:46:03 675 0
1 条回答
写回答
取消 提交回答
  • 网络规划设计师、敏捷专家、CISP、ITSS服务经理、ACA全科目、ACP4项、ACE、CBP、CDSP、CZTP等。拥有 PRINCE2 Foundation/Practitioner、CCSK、ITIL、ISO27001、PMP等多项国际认证。 专利5+、期刊10+、知识产权师。核心期刊审稿人。
    采纳回答

    您好,需要带上cookie才有数据,用一个seesion访问2次就行了。这个站点做了限制 有正确的cookie才能访问,第一次访问服务器会下发cookie 第二次带上就行,由于requests.session()会自动保存cookie所以访问2次就行了。 常见,而且这是比较初级的的反爬手段 image.png

    2021-10-19 20:47:54
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载