搜索引擎优化作弊是指针对搜索引擎算法的不完善而采取相应欺骗性手段提高页面权重及相关性的行为,按照作弊的操作范围可分为“内部作弊”及“外部作弊”。
内部作弊是指通过操控网站内部因素影响页面权重及相关性的行为;而外部作弊则是指通过操控网站外部因素(外部链接)影响页面权重及相关性的行为。常见的搜索引擎优化作弊方式包括:
1. 关键字堆砌
2. 隐藏文本
3. 镜像网站
4. 门页
5. 302 重定向
6. 伪装
7.链接欺骗
其中,1-6 属于内部作弊,而 7 属于外部作弊。
1. 关键字堆砌
关键字堆砌是指在页面上堆放大量与页面主题相关或无关的关键字,这样做是为了增加某些关键字的词频以提高页面相关性。在页面中常用于堆砌关键字的区域包括“正文内容”、“<noframe>标签”及“注释”。 正文内容中堆砌关键字是指在页面主体标记(即<body>…</body>标签间)的任何位置 上堆放与页面相关或无关的关键字,如下图所示。
在页面正文内容中堆砌关键字不仅会影响页面美观及用户体验,而且还是一种欺骗搜索引擎的违规行为,搜索引擎轻易就能识别。
2. 隐藏文本
隐藏文本是最早也是最简单的搜索引擎优化作弊方式之一,通过“隐藏”页面中堆砌的关键字,达到既增加关键字词频、提高页面相关性,又不影响页面美观及用户体验的目的。
“隐藏文本”通常通过控制文本的“字号”及“颜色”属性值来实现。因此,这些“隐藏文本”对于普通用户来说是不可见的,但搜索引擎却可以识别。
(注:“隐藏文本”也是“关键字堆砌”的一种方式。)
3. 镜像网站
广义上的镜像网站是指那些复制或者抄袭其他网站内容的网站。常见的镜像网站有三种:
第一种是克隆网站,指在内容完全相同的网站 上绑定多个域名(这些内容可能在同一服务器上,也可能在不同的服务器上),例如:在相同内容的网站上同时绑定域名“www.pqshow.net”与“www.pqshow.com”。
第二种是为内容完全相同的网站制定多套不同风格的页面模版,再绑定多个域名。
第三种是数据采集网站,指网站中所有的内容都是通过采集程序采集的。
为了减少搜索结果中的重复信息,提高用户体验,搜索引擎会降低镜像网站的权重或者忽略镜像网站的内容。
4. 门页
“门页”即“Doorway Pages”,也称为桥页、跳转页或入口页,是指针对搜索引擎而进行特别优化的页面,当用户访问门页时,会自动(或引导用户手动)跳转至另外一个内容完全不同的页面上。 例如:“页面 1”、“页面 2”都是“网站 A”的页面,“页面 1”针对搜索引擎进行过特别的优化,而“页面 2”是一个正常的页面。当普通用户访问该网站时,会从“页面 1”自 动(或引导用户手动)跳转至“页面 2”,即“页面 1”存在的目的是引导用户进入“页面 2”;当搜索引擎访问该网站时首先得到的是“页面 1”,而“页面 2”则可能被忽略。这样,这个经过特别优化的“页面 1”就可以在搜索引擎中得到较好的表现,而普通用户在搜索结果中点击“页面 1”的链接时,也会自动(或引导用户手动)进入“页面 2”。这时,我们称“页面 1”为门页。 门页可能是针对一个搜索引擎,也可能是针对多个不同的搜索引擎。由于每个搜索引擎的算法会存在或多或少的差异,有些人为了提高网站在各个搜索引擎中的表现,会针对不同的搜索引擎建立不同的门页,再对不同的搜索引擎蜘蛛程序返回相应的门页。
例如:如果程序监测到前来访问的是 Googlebot,则返回针对 Google 而进行过特别优
化的页面;如果是百度的 BaiduSpider,则返回针对百度进行过特别优化的页面。
搜索引擎轻易就能识别门页。对于使用门页的网站,搜索引擎的处罚是非常严厉的,轻者降低网站权重,重者直接从索引中清除。
5 伪装
“伪装”即 Cloaking,是指根据用户身份返回不同页面的行为,是门页最常用的跳转方式之一。例如:面对搜索引擎及普通用户返回不同的页面,向搜索引擎返回经过特别优化的页面,而对普通用户则返回正常的页面。不管在什么情况下,“伪装”都是欺骗搜索引擎的违规行为,因此会受到搜索引擎的惩罚。
“伪装”实现原理:首先对前来访问的用户的头部代理信息进行判断,如果是搜索引擎蛛蜘程序则返回为搜索引擎而准备的页面,否则返回正常的页面。在进行“伪装”时你必须知道搜索引擎蜘蛛程序的头部代理信息,这些信息我们可以在服务器日志上查看到。例如:Google 蛛蜘程序“Googlebot”,百度蛛蜘程序“baiduspider”。 下面介绍以 PHP 实现的“伪装”代码:
<?php
$trouve=strpos(