开发者社区> 问答> 正文

反爬和应对的措施有哪些?

反爬和应对的措施有哪些?

展开
收起
游客qzzytmszf3zhq 2021-12-08 22:31:05 229 0
1 条回答
写回答
取消 提交回答
  • ( 1)通过user-agent来判断是否是爬虫。

    解决方案:可以通过伪装请求头中的user-agent来解决。若user-agent被检测到,可以找大量的user-agent,放入列表,然后进行更换

    (2)将IP进行封杀。

    解决方案:可以通过代理来伪装IP。

    (3)通过访问频率来判断是否是一个爬虫。

    解决方案:可以通过设置请求间隔,和爬取间隔。

    (4)当一定时间内的总请求数超过上限,弹出验证码。

    解决方案:对于简单的验证码图片可以使用tesseract来处理,对于复杂的可以去打码平台。

    (5)通过JS来获取页面数据。

    解决方案:可以使用selenium+phantomjs来加载JS获取数据。

    2021-12-08 22:43:00
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
移动威胁和风险在长尾上的迁徙 立即下载
攻击过程的威胁情报应对体系 立即下载
千里之外,洞悉风险——网站安全即服务 立即下载