页面隐藏作弊通过一些手段瞒骗搜索引擎爬虫,使得搜索引擎抓取的页面内容和用点击查看到的页面内容不同,以这种方式来影响搜索引擎的搜索结果。常见的页面
1. IP地址隐形作弊(IP Cloaking )
网页拥有者在服务器端记载搜索引擎爬虫的IP地址列表,如果发现是搜索引擎在请重
页面,则会推送给爬虫个伪造的网页内容, 而如果是其他 IP地址,则会推送另外的网面
内容,这个页面往往是有商业目的的营销页面。
2. HTTP请求隐形作弊( User Agent Cloaking )
客户端和服务器在获取网页页面的时候遵循HTTP协议,协议中有一项叫做用户代理项。搜索引擎爬虫往往会在这一项有明显的特征服务器如果判断是搜索引擎爬虫则会推送与用户看到的不同的页面内容。
3. 网页重定向
作弊者使搜索引擎索引某个页面内容,但是如果是用户访问则将页面重定向到一个新的页面.
4.页面内容隐藏
通过一些特殊的 HTML标签设置,将-部分内容 显示为用户不可见,但是对于搜索引擎来说是可见的。比如设置网页字体前景色和背景色相同,或者在Css中加入不可见层来隐藏页面内容。将隐藏的内容设置成一些与网页主题无关的搜索词,以此增加被用户访问到的概率。