开发者社区> 问答> 正文

如何辨别真假百度蜘蛛

这个月月初的时候,检查日志发现 发现这个ip 标注自己是 baiduspider
但是抓取网页特别多 一刻不停的抓取  浪费带宽
这个时候就开始怀疑这个ip到时是不是百度的蜘蛛

找到一个检测真假百度蜘蛛ip的办法
如果是win系统的话  输入 cmd 打开命令行
在弹出框中输入nslookup 空格 ip段,返回的结果如果包含crawl.baidu.com就是真的百度蜘蛛
比如这个就是真的


如果不是真的 ,linux的可以直接用iptables 禁止ip访问
ssh里边输入下边的命令

iptables -A INPUT -s 220.101.110.140 -j ACCEPT


输入这个命令  这个ip 就不继续抓取你的网页了

展开
收起
小猪猪 2013-11-27 12:19:08 9527 0
1 条回答
写回答
取消 提交回答
  • 学习啦、
    2013-11-29 22:20:34
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
AIOps-百度的思考与实践 立即下载
百度外卖从IDC到云端服务迁移历程 立即下载
百度研发工具集的应用实践——打造持续交付路上的“三堵墙” 立即下载