开发者社区> 问答> 正文

网站加上cdn以后,内容乱套 回源要怎么设置

网站加上cdn以后,内容乱套 回源要怎么设置

展开
收起
刘兴阳 2021-10-22 22:01:18 4554 0
1 条回答
写回答
取消 提交回答
  • 下一站是幸福

    版权归作者所有,任何形式转载请联系作者。 作者:时光在路上豆瓣(来自豆瓣) 来源:https://www.douban.com/note/667243528/

    很多人设置了CDN回源,这样可以让一些蜘蛛直接回源站点抓取数据。这样做的好处是:可以保障网站内容对蜘蛛的稳定性,便于抓取到数据。

    但是这样做也有坏处:

    1. 如果服务器不是很好、网站内容设置不太好,会拖慢蜘蛛抓取所用的时间;

    2. 到底对哪些蜘蛛回源?这个并不是公开的数据,而是各个CDN公司内部设置的机制,而有些假冒蜘蛛的ip可能会直接找到网站服务器的真实地址,进行各种攻击活动:因为毕竟是回源了的,所以各种404、403、5xx都会在真实服务器上发生,给自己的主机服务器带来风险和不小的负担;

    3. 蜘蛛抓取主要是看你的网址上的网页是否打得开、开得快,链接内容是否稳定,是否影响抓取,如果这些都没问题,回源和不回源,个人认为区别不大。

    不回源的好处是:把部分负担和风险抛给了CDN服务器,也同时缩短了抓取时间,如果自己主机没有做gzip压缩的话,CDN帮你把主页压缩了,蜘蛛抓取速度提升了一大截。


    个人愚见,欢迎探讨。

    2021-10-23 11:42:15
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
构建智能化的视频系统 阿里云CDN的进化 立即下载
CDN数据化实践 立即下载
直播CDN-X - 白山直播CDN流传递链路优化 立即下载