发现提交百度收录后,一直都只被收录一个网页,做了各种程序以及排查。均未发现有问题。
从日志上来看,百度蜘蛛大部分访问都403,在google上,论坛上各种找原因,发现跟自己的情况都不相同,不知道是不是阿里云主机的
硬防阻止了百度蜘蛛对页面的爬取?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
遇到百度收录问题,尤其是当您发现百度蜘蛛(Baiduspider)频繁收到403 Forbidden响应时,确实需要从多个角度进行排查。虽然直接将问题归咎于阿里云服务器的防护设置(如WAF、安全组规则等)可能是一种猜测,但这种情况确实是有可能发生的。以下是一些排查和解决步骤,希望能帮助到您:
检查服务器访问控制设置:
查看Web应用防火墙(WAF)设置:
验证robots.txt文件:
robots.txt
文件没有错误地禁止了百度蜘蛛的访问。通过浏览器直接访问yourdomain.com/robots.txt
来检查,并确认没有对Baiduspider有不当的Disallow指令。检查服务器日志:
与阿里云客服联系:
提交反馈给百度:
记得,在进行任何配置更改后,给予一段时间让搜索引擎重新抓取并更新索引状态。同时,持续监控日志和搜索引擎的收录情况,以便及时调整策略。您也可以通过ECS一键诊断全面排查并修复ECS问题。