开发者社区> suboysugar> 正文

SEO优化:WordPress发布文章主动推送到百度,加快收录保护原创

简介: 工作实在太忙,也没时间打理网站。最近公司额外交待了一些网站 SEO 方面的优化任务让我关注(这就是啥都要会、啥都要做的苦逼运维的真实写照了...)。 于是抽空看了下百度站长平台,至少看到了2个新消息: ①、百度已全面支持https网站,并倡导说使用https会优先收录; ②、主动推送将逐步取代实时推送,实时向百度推送新数据。
+关注继续查看

工作实在太忙,也没时间打理网站。最近公司额外交待了一些网站 SEO 方面的优化任务让我关注(这就是啥都要会、啥都要做的苦逼运维的真实写照了...)。

于是抽空看了下百度站长平台,至少看到了2个新消息:

①、百度已全面支持https网站,并倡导说使用https会优先收录;

②、主动推送将逐步取代实时推送,实时向百度推送新数据。

WordPress发布文章主动推送到百度,加快收录保护原创

对于第一点,个人认为现阶段https不管是从兼容性还是从速度上还是差强人意的。尤其是一些免费的SSL证书,虽然可以让我等屌丝网站瞬间提高逼格,营造一种高大上的赶脚。但是国内其他几家搜索引擎貌似还不能支持https的收录,所以我个人建议可以暂时先观望一下,等技术和时机成熟再来实现整站https。

对于第二点,我第一时间想到的就是百度WordPress数据化结构插件—baidusubmit可以删除,但后面发现其实这2个机制是可以共存的,不过依过往经验来看,如果同时使用,我个人建议关闭百度的数据化结构插件的实时推送功能,避免重复推送通知,造成收录困扰!

一、主动推送

先来看下百度对于主动推送的一些说明:

主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。

主动推送支持多种途径:比如curl 、post、php以及ruby等。而且支持一次性提交多条网站页面地址,不过每个站点每天可推送的次数暂时限制在50次。

 
使用主动推送功能会达到怎样效果?
①、及时发现:可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录
②、保护原创:对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现

——摘自百度官方:原文地址

二、PHP代码

①、WrodPress 通用方式【推荐使用】

补充于2015-07-03:不经意看到张戈博客之前写的发布文章同步新浪微博的代码,突然发现原来都可以更简单!因为 WordPress 本来就存在支持 POST 或 GET 方法的 WP_Http 类,这样一来妈妈再也不用担心我的主机是否支持这个支持那个了!

先摘一段来自鱼叔的相关描述:

在 PHP 中发起 HTTP 请求并不是很难,有很多种方法:使用 fopen() 函数,使用 CURL 扩展,使用文件操作函数如 fsockopen() 和 fwrite()等,但是问题是各种方法所依赖的服务器的配置把不同,有些服务器可能无法支持,不过 WordPress 自身开发了新的 API WP_Http 使得 WordPress 在所有环境下都非常容易发起 HTTP Request。

PHP 类:WP_Http

WordPress 2.7 开始引入了一个新的 PHP Class:WP_Http(在 wp-includes 目录 http.php 文件中)。这个 Class 的强大之处是它会检测服务器的情况,选择最好的方法去实现 HTTP 请求,所以我们自己无须去检测 HTTP 扩展,fopen(),是否存在curl_init() 函数,这个 Class 都会包办这些检测。

                  -------摘自我爱水煮鱼《使用 WP_Http 在 WordPress 中发起 HTTP Request

简单的修改一下之前的代码,即可轻松搞定:

 

②、curl_init 方式

WordPress发布文章主动推送到百度的代码非常简单,只要稍微修改一下张戈博客之前分享的《WordPress发布文章自动同步到新浪微博(带特色图片)》中的代码即可搞定:

 

③、file_get_contents 方式

鉴于有个别站长反馈代码添加后,发布或更新文章,自定义栏目中都不会出现我们期望的baidusubmit,我要他们检查 token 和域名,也反馈是正确的,直到我亲自给一个站长 Debug 时才发现是他主机的 curl_exec()函数被禁用了!既然这个函数都不能用了,那代码也肯定无法正常推送了!

于是,我额外写了一个普遍支持的 file_get_contents 方式,代码如下:

Ps:file_get_contents 的运行效率应该是略低于curl的,不过就推送一条数据,就基本没有差别啦!如果你使用第一种方式没有成功,那么就试试 file_get_contents 方式吧!

③、代码部署

从上面选好合适的代码后(推荐①),先打开百度官方页面:http://zhanzhang.baidu.com/linksubmit/index,获取你网站的专属的 token 值,替换到代码中的 "xxxxxxxxx"(Ps:域名已更新为动态变量,无需另外更改)。

WordPress发布文章主动推送到百度,加快收录保护原创

最后将修改后的代码添加到主题目录下的 functions.php 函数模板并保存。

现在发布新文章,文章地址将会被主动推送到百度。被成功推送的文章,将自动出现如下自定义栏目:

WordPress发布文章主动推送到百度,加快收录保护原创

从而避免代码重复推送的尴尬,如果你需要更新文章再次推送数据,那么删除或修改这个自定义栏目即可再次被推送。

Ps:虽然,主动推送的各种方法都支持一次推送多条数据,从我个人的经验来看,对于老文章没必要再次推送,频繁推送容易导致百度“翻脸”!

三、其他说明

用心思考的童鞋,应该可以看出百度的目的应该是为了获取文章准确的发布时间,这一项改进很明显就是为了配合之前百度取消快照之后,新增的“文章发布时间"的改动:

WordPress发布文章主动推送到百度,加快收录保护原创

我个人认为,之前百度应该是通过分析文章中的时间戳来确认原创文章的发布时间。但是时间戳是可以作弊的,而百度蜘蛛的抓取也不是及时的,这样就带来了文章是否真实原创的争议!比如张戈博客发布一篇文章,蜘蛛还没来得及抓取,就被大站转走而且还不带来源链接,就会出现一种情况:大站的蜘蛛抓取频繁,第一时间就抓到了转载的文章,认为是原创,而真正的原创却由于后抓取被蜘蛛认为是伪原创!是个人都要吐血了吧?

现在有了主动推送就好多了,高质量原创文章发布,第一时间就会推送到百度,从而告知了最准确的原创来源,从而杜绝了抄袭者和原创者出现角色互换的尴尬!还在使用老版 baidusubmit 插件的朋友,可以赶紧试试张戈写的代码了!

最新补充:早上不经意看到百度官方推荐文章,果然不出我所料:

新的主动推送工具最大的亮点就是“快”。
这个工具直接将链接推送给百度,而原来的工具推送的是结构化数据,需要百度进一步解析和内部排序。天下功夫,唯快不破。高手对决中,1微秒决定胜负。快速推送带来的好处是两方面的:一是及时发现,可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录;二是保护原创,对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现。

新的主动推送工具第二个特点就是“人性化”。
首先是密匙的人性化,同一个帐号下所有站点的密匙相同。这一点对于一个绑定了多个子域名的大站来说,是个福音,不用为每个子域名写个推送程序,节省时间成本和技术成本。第二个人性化是返回数据人性化,返回数据包含返回码和message,推送完后能立即知道推送结果,而老的工具推送后要登录后台才能查看推送结果。

另外,使用这个插件时必须确保推送的是最新、高质量的网页链接。
  刚才说新工具的最大亮点是快,之所以能快,是因为跳过了正常抓取时的好几个步骤。百度这样做,是希望能更加快速的抓取到高质量的网页。如果一个网站经常推送一些老的、垃圾页面的链接,百度会很生气的,会认为网站辜负了他的信任,直接后果是百度不再信任这个网站的推送,导致工具失效,是否有其它更恶劣的后果,比如降低网站评价,这个还有待进一步观察。所以,使用这个工具时一定要注意,老的、低质量的网页链接不要推送了。(Ps:为了测试我的代码,我连续推送了十几次老文章,也是醉了。。。)

然后这位仁兄还给出了主动推送和实时推送的对比清单:WordPress发布文章主动推送到百度,加快收录保护原创

不久,我又在百度官方WIKI看到了相关文章,已更新到上文当中 。

如何联系我:【万里虎】www.bravetiger.cn 【QQ】3396726884 (咨询问题100元起,帮助解决问题500元起) 【博客】http://www.cnblogs.com/kenshinobiy/

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
个人网站5-网站SEO优化推广和增加百度谷歌收录
个人网站5-网站SEO优化推广和增加百度谷歌收录
55 0
百度SEO基础优化
一、网站的基本素质   1、新站建立时适当交换外链,利于Spider爬取发现资源;也可以前往百度搜索资源平台向百度搜索主动提交站点新增的高时效性资源,缩短爬虫发现网站的时间;   2、首页内容要保持一定的更新速度,持续优化,并且视觉感官上符合简单明了、主题明确、无冗杂信息等特质;
35 0
【Hexo】如何才能在百度搜索到你的博客?SEO优化了解一下(上)
【Hexo】如何才能在百度搜索到你的博客?SEO优化了解一下(上)
232 0
百度优化中不要走入外链的误区
众所周知外部关键字链接对网站提升排名具有不可估量的地位。有很多seoer为客户做搜索引擎优化的过程中或者会使用一些群发工具、或者会去花钱购买一些链接来为客户的网站增加外链从而达到提高排名的目的。精灵也使用过这样的方法,的确是非常有效,对于一些不太热门的关键词,甚至可以在短时间内把排名直接提到搜索的第一位。
49 0
谈谈2010年网站百度优化新技术
Html标签的使用、关键词密度和位置、URL命名等页面布局在网站优化中占有很大的权重,尤其对于百度而言,所以学习竞争对手的页面布局再根据自身网页的特点进行修改,你可以省去很多时间,但各自网页的权重是不一样的,所以你不仅要去研究领先的竞争对手,还可以研究一下比自己落后的竞争对手,取其精华、去其糟粕。
68 0
2010年9月百度优化新方式
百度优化最新方式百度引导量是最新一种百度优化方式,也是目前百度优化的“绝密”优化“武器”之一。 由于百度优化算法的近期调整,各个优化团队或个人也都在不停的跟进百度的最新算法,当然我们的也在日夜不停的跟进百度的最新排名动向,最终在九月初研究了最新的百度优化方式——百度引导量,当此方法一出,很多八月份受影响的词大量恢复正常,并且有了很好的排名。
42 0
优化百度新闻内容的7个技巧
优化百度新闻内容的7个技巧 百度新闻发生了巨大变化。许多优化新闻内容的最佳做法也发生了重大变化。 但是,百度新闻优化的一些基本原则在过去16年中基本没有改变。 优化新闻内容以提高可见性和流量的关键是弄清楚哪些内容已发生变化,哪些内容未发生变化。
1044 0
SEO关键词优化:如何理解被百度快速索引?
SEO关键词优化:如何理解被百度快速索引? 经常会有SEO人员讨论,为什么我的SEO关键词总是不被快速索引,而实际上这里主要指的是,针对特定关键词的核心内容,那么,它主要涉及如下两个指标: ①索引 ②快速收录 这里值得说明的是:索引并不等于收录,索引只是被百度抓取后,进入百度的索引库中,它并不一定会在百度搜索结果中展现。
1178 0
如何针对百度语音搜索优化您的网站
如何针对百度语音搜索优化您的网站 随着我们越来越深入到技术时代,出现了数千种不同类型的新技术。 随着通过数字个人助理询问越来越多的搜索查询,语音搜索变得越来越普遍,优化语音搜索势在必行。 语音搜索优化的目标是通过仅关注所需信息来减少信息混乱。
1168 0
+关注
suboysugar
目前为自由职业者,从事BA业务分析和互联网产品设计等工作,本人先后在中关村在线、中国工商银行和神州数码工作。拥有互联网,移动互联网,软件公司等开发经历。计算机本科毕业,8年互联网和软件行业经验。
文章
问答
文章排行榜
最热
最新
相关电子书
更多
百度大规模时序指标自动异常检测实战
立即下载
从百度文件系统看大型分布式系统设计
立即下载
百度万人研发团队 Git 工具链建设的挑战与思考
立即下载