通过PHP判断搜索引擎蜘蛛是否访问你的网站

简介:
< DOCTYPE html PUBLIC -WCDTD XHTML StrictEN httpwwwworgTRxhtmlDTDxhtml-strictdtd>



搜索引擎的蜘蛛访问网站是通过远程抓取页面来进行的,我们不能使用JS代码来取得蜘蛛的Agent信息,但是我们可以通过image标签,这样我们就可以得到蜘蛛的agent资料了,通过对agent资料的分析,就可以确定蜘蛛的种类、性别等因素,我们在通过数据库或者文本来记录就可以进行统计了。
数据库结构:

#
# 表的结构 `naps_stats_bot`
#

Create TABLE `naps_stats_bot` (
`botid` int(10) unsigned NOT NULL auto_increment,
`botname` varchar(100) NOT NULL default ‘’,
`botagent` varchar(200) NOT NULL default ‘’,
`bottag` varchar(100) NOT NULL default ‘’,
`botcount` int(11) NOT NULL default ‘0&prime;,
`botlast` datetime NOT NULL default ‘0000-00-00 00:00:00&prime;,
`botlasturl` varchar(250) NOT NULL default ‘’,
UNIQUE KEY `botid` (`botid`),
KEY `botname` (`botname`)
) TYPE=MyISAM AUTO_INCREMENT=9 ;

#
# 导出表中的数据 `naps_stats_bot`
#

Insert INTO `naps_stats_bot` VALUES (1, ‘Googlebot’, ‘Googlebot/2.X (+http://www.googlebot.com/bot.html)’, ‘googlebot’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (2, ‘MSNbot’, ‘MSNBOT/0.1 (http://search.msn.com/msnbot.htm)’, ‘msnbot’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (3, ‘Inktomi Slurp’, ‘Slurp/2.0&prime;, ’slurp’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (4, ‘Baiduspider’, ‘Baiduspider+(+http://www.baidu.com/search/spider.htm)’, ‘baiduspider’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (5, ‘Yahoobot’, ‘Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)’, ’slurp’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (6, ‘Sohubot’, ’sohu-search’, ’sohu-search’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (7, ‘Lycos’, ‘Lycos/x.x’, ‘lycos’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);
Insert INTO `naps_stats_bot` VALUES (8, ‘Robozilla’, ‘Robozilla/1.0&prime;, ‘robozilla’, 0, ‘0000-00-00 00:00:00&prime;, ‘’);

PHP程序:

<?php

  

  

  
error_reporting(E_ALL & ~E_NOTICE);
  
function get_naps_bot()
{
         $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
                        
         if (strpos($useragent, 'googlebot') !== false){
                 return 'Googlebot';
         }
        
         if (strpos($useragent, 'msnbot') !== false){
                 return 'MSNbot';
         }
        
         if (strpos($useragent, 'slurp') !== false){
                 return 'Yahoobot';
         }
        
         if (strpos($useragent, 'baiduspider') !== false){
                 return 'Baiduspider';
         }
        
         if (strpos($useragent, 'sohu-search') !== false){
                 return 'Sohubot';
         }
        
         if (strpos($useragent, 'lycos') !== false){
                 return 'Lycos';
         }
        
         if (strpos($useragent, 'robozilla') !== false){
                 return 'Robozilla';
         }        
         return false;
}
  
$tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
//添加蜘蛛的抓取记录
$searchbot = get_naps_bot();
if ($searchbot) {
         $DB_naps->query("Update naps_stats_bot SET botcount=botcount+1, botlast=NOW(), botlasturl='$tlc_thispage' Where botname='$searchbot'");
}
  
?>

本文转自 netcorner 博客园博客,原文链接: http://www.cnblogs.com/netcorner/archive/2007/08/03/2912321.html ,如需转载请自行联系原作者

相关文章
|
4月前
|
缓存 NoSQL 网络安全
【Azure Redis 缓存】Azure Redis服务开启了SSL(6380端口), PHP如何访问缓存呢?
【Azure Redis 缓存】Azure Redis服务开启了SSL(6380端口), PHP如何访问缓存呢?
|
10天前
|
Linux PHP 数据安全/隐私保护
2024授权加密系统PHP网站源码
2024授权加密系统PHP网站源码
89 58
|
29天前
|
关系型数据库 MySQL PHP
PHP与MySQL的无缝集成:构建动态网站的艺术####
本文将深入探讨PHP与MySQL如何携手合作,为开发者提供一套强大的工具集,以构建高效、动态且用户友好的网站。不同于传统的摘要概述,本文将以一个生动的案例引入,逐步揭示两者结合的魅力所在,最终展示如何通过简单几步实现数据驱动的Web应用开发。 ####
|
29天前
|
SQL 前端开发 PHP
如何使用PHP开发一个购物网站?
在数字化时代,线上购物日益重要。本文介绍如何使用PHP开发一个功能完善、用户友好的购物网站,涵盖需求分析、开发环境选择、数据库设计、前后端开发、用户认证、商品展示、购物车、订单管理、功能扩展及安全性能优化等环节,旨在提供全面的开发指南。
35 3
|
1月前
|
PHP
20241125易支付PHP网站源码
PHP74,上传源码后解压访问域名/install 进行安装 安装完成 之后一定要设置伪静态 源码里面nginx.txt 就是伪静态 然后复制粘贴到伪静态里面保存即可
41 2
|
1月前
|
关系型数据库 MySQL PHP
骗子曝光系统网站PHP源码
骗子曝光系统网站PHP源码 PHP 7.0+ Mysql 5.6+ 上传访问域名/install安装
44 2
|
1月前
|
JavaScript PHP 数据安全/隐私保护
乞丐在线要饭系统PHP网站源码
在这个物欲横流、竞争激烈的时代,有时候我们真心觉得钱来得太不容易,甚至连最基本的生存都成了负担。于是,我们想出了一个特别“独特”的点子:用利息砸我,给我点施舍!
77 1
|
27天前
|
关系型数据库 MySQL PHP
PHP与MySQL的深度整合:构建高效动态网站####
在当今这个数据驱动的时代,掌握如何高效地从数据库中检索和操作数据是至关重要的。本文将深入探讨PHP与MySQL的深度整合方法,揭示它们如何协同工作以优化数据处理流程,提升网站性能和用户体验。我们将通过实例分析、技巧分享和最佳实践指导,帮助你构建出既高效又可靠的动态网站。无论你是初学者还是有经验的开发者,都能从中获得宝贵的见解和实用的技能。 ####
21 0
|
1月前
|
人工智能 搜索推荐 PHP
PHP在Web开发中的璀璨星辰:构建动态网站的幕后英雄###
【10月更文挑战第25天】 本文将带您穿越至PHP的宇宙,揭示其作为Web开发常青树的奥秘。通过生动实例与深入解析,展现PHP如何以简便、高效、灵活的姿态,赋能开发者打造动态交互式网站,同时不忘探讨其在新时代技术浪潮中面临的挑战与机遇,激发对技术创新与应用的无限思考。 ###
38 1
|
2月前
|
SQL 关系型数据库 MySQL
PHP与MySQL协同工作的艺术:开发高效动态网站
在这个后端技术迅速迭代的时代,PHP和MySQL的组合仍然是创建动态网站和应用的主流选择之一。本文将带领读者深入理解PHP后端逻辑与MySQL数据库之间的协同工作方式,包括数据的检索、插入、更新和删除操作。文章将通过一系列实用的示例和最佳实践,揭示如何充分利用这两种技术的优势,构建高效、安全且易于维护的动态网站。