开发者社区> 问答> 正文

关于蜘蛛

上个月,阿里云的一个用户,在这里发帖求助,登录上去查看到的情况,如下图。






tcpdump抓包grep出user-agent,可以看到,这几十个请求里,正常的浏览器访问,只占到一个零头,剩下的都是蜘蛛。
而在蜘蛛里,yisou的蜘蛛又占了一大半。这个应该算是极端的情况了,大多数网站都不会有这么多的yisou蜘蛛抓。


蜘蛛爬的多了,硬件资源用的对应的就多了,甚至把服务器爬死。为了节省资源,可以对照下访问量统计和日志,把那些爬的多的来的IP少的蜘蛛屏蔽了。

展开
收起
云代维 2013-10-08 23:48:36 13110 0
9 条回答
写回答
取消 提交回答
  • Re关于蜘蛛
    能不能直接在IIS里设置限制YisouSpider这个关键字?
    2017-01-24 09:02:47
    赞同 展开评论 打赏
  • Re关于蜘蛛
    学习了
    2014-10-24 11:02:28
    赞同 展开评论 打赏
  • Re关于蜘蛛
    怎么查看是伪蜘蛛?还有求介绍好的蜘蛛日志分析软件
    2014-10-24 09:40:06
    赞同 展开评论 打赏
  • 回5楼服务器之家的帖子
    屏蔽IP好用吗?蜘蛛IP可能多变吧。。
    2014-10-24 07:55:41
    赞同 展开评论 打赏
  • 回 3楼(dns2008) 的帖子
    日志里有IP,没发出来而已。
    2013-10-09 12:12:25
    赞同 展开评论 打赏
  • 伪蜘蛛
    2013-10-09 12:05:21
    赞同 展开评论 打赏
  • 也有可能是伪蜘蛛攻击
    2013-10-09 11:35:58
    赞同 展开评论 打赏
  • linux的怎么屏蔽?
    2013-10-09 11:30:54
    赞同 展开评论 打赏
  • 看来有些蜘蛛不要也呗,收录再多,带来不了流量也是没用的。
    2013-10-09 08:10:02
    赞同 展开评论 打赏
滑动查看更多
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载