搜索引擎识别镜像、转载网页

简介:

众所周知,原创文章和转载文章,搜索引擎会更加重视原创性内容。因此,很多SEOers就提出了所谓伪原创的手法。简单的说,伪原创就是对原创性文章进行相应的修改,从而企图达到让搜索引擎认为他是原创性文章的目的。

  下面,介绍地介绍一下搜索引擎识别镜像、转载网页的方法:

1. 转载网页的识别:例如:对于网页A,B,要判断这两个页面是否互为转载网页,那么搜索引擎首先会把这两个网页的主体内容(如文章内容)划分为若干个独立的区域,再按顺序对这些区域进行比较,如果这些区域的内容大部分都是相同,那么搜索引擎就认为这两个页面互为转载页面;然后,再根据网页建立的时间等多方面的因素判断哪个是原创页面,哪个是转载页面。

2.镜像页面的识别:例如:对于网页A,B,要判断这两个页面是否互为镜像网页,那么搜索引擎首先会把这两个网页划分为若干个独立的区域,再按顺序对这些区域进行比较,如果这些区域的内容完全相同,那么搜索引擎就认为这两个页面互为镜像页面;然后,再根据网页建立的时间等多方面的因素判断哪个是原创页面,哪个是镜像页面。

从上面的内容里,我们得知了搜索引擎识别转载页面的原理。简单地说,如要我们要让搜索引擎认为我们的内容是原创内容,那么首要的条件就是我们的网页跟另外一个网页在主体内容(如文章内容)上存在明显的差别。例如:一篇文章有四个段落,当有三个段落的内容存在差异时,会被认为是原创网页,而两个段落内容存在80%以上的差别上,才会被认为是不同的段落。



本文转自william_xu 51CTO博客,原文链接:http://blog.51cto.com/williamx/721652,如需转载请自行联系原作者

相关文章
|
数据采集 算法 SEO
谷歌seo做的外链怎样更快被semrush识别
当然,做谷歌排名是一件很简单的事情,但很多人做外贸的却没能力把谷歌排名做起来。
128 0
谷歌seo做的外链怎样更快被semrush识别
|
数据采集 存储 搜索推荐
如何高效实现搜索引擎网页爬取
如何高效实现搜索引擎网页爬取
|
Web App开发 搜索推荐 .NET
识别真假搜索引擎(搜索蜘蛛)方法(baidu,google,Msn,sogou,soso等)
http://www.useragentstring.com/pages/useragentstring.php   今天分析研究了两个网站的 Apache 日志,分析日志虽然很无聊,但却是很有意义的事情,比如跟踪 SPAM 的 User Agent。
3582 0
|
搜索推荐 JavaScript
零基础打造一款属于自己的网页搜索引擎
零基础打造一款属于自己的网页搜索引擎
246 0
零基础打造一款属于自己的网页搜索引擎
|
SEO 算法 UED
创建SEO友好的内容让网站排名第一
如何创建SEO友好内容:最好的6个技巧 搜索引擎优化通常涉及一些标签转移,精心连接权威网站,以慢慢爬上排名。 虽然“如果你构建它,它们会来”的方法确实是网络内容实际上并没有带来流量 – 因为好的内容并不总是浮出水面 – 你的内容也是如此限制你的排名。
815 0
|
安全 计算机视觉
趋势科技称谷歌视频搜索含大量恶意网站链接
据国外媒体报道,趋势科技今日指出,谷歌视频搜索中约有40万个搜索结果链接到可重定向的恶意网站,访问这些网站将感染安装Windows操作系统的电脑。 趋势科技称,这些恶意软件使用了所谓的AQPlay-A方式进行攻击,用户访问这些恶意网站时,会要求升级Adobe Flash播放器以查看特定的视频内容,一旦在未受保护的电脑上运行该升级软件将会被感染。
1306 0
|
搜索推荐 索引 SEO
如何针对SEO优化您网站上的文本
如何针对SEO优化您网站上的文本 这是一些文字。 这是粗体文字。 斜体。 这个(表面上)意味着我对于我所说的内容非常严重。 有一件事是肯定的,您网站上的文字对于建立网站的权威至关重要。您在给定页面上使用的实际单词需要针对两件事进行优化:用户和搜索引擎。
1298 0
|
搜索推荐 UED SEO
1.如何让搜索引擎更好的收录网站内容
 如何让搜索引擎更好的收录网站内容   搜索引擎只是网站上的一个普通的访客,对网站的抓取方式,对网站/网页的价值判断,也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进,对搜索引擎的优化,同时也会让用户受益。
1231 0