定伟:百度如何处理不相关静态搜索结果页(搜索聚合页)

其实宏观来看,所有网站都只有两种类型的网页:内容页和聚合页。

内容页是具体的信息页,是网站的根本,也是用户真正需要的页面;而其他页面实际上都是通过对内容页的聚合,按照一定的规则把内容页中的部分内容和内容页的链接聚合到一个页面上,按照URL层级设计、页面内容及链接布局,分出了以上所提到的内容页之外的其他各类页面。或搜索聚合,或标签聚合,或格式化数据聚合,或属性聚合,或专题化聚合。在数据库中看,内容页会有很多属性和标签,这些属性和标签就为“聚合”提供了便利条件。分类目录页、TAG聚合页、专题页等都是根据内容的单一属性或标签进行的聚合;网站首页和频道首页是对内容进行了多属性和标签的聚合,只是为每个属性或标签单独设立了一个数据调用模块。在这些聚合中处处都透露着“站内搜索”的影子。既然除了内容页之外都是聚合页,那么站内SEO相对就容易研究了。比如在常见的页面类型中,研究除了内容页之外哪类页面是最容易获得搜索排名的,这类页面本身从URL设计、关键词定位、内容布局、内容页的聚合方式、内链设计及外链获取上相对于其他类型的聚合页面有什么优势等问题。TAG页是聚合页,网站的传统目录和专题页也是聚合页,只是模板不同而已,那为什么网站的目录页和专题页就可以获得良好的收录和排名,TAG页就不可以呢?此时就需要挖掘一下网站目录页和专题页的特点和优势,并把这种优势也融入到TAG页的设计中去。

可以通过人工为内容打标签、让技术配合使用中文分词和TF-IDF自动为内容打标签、直接为内容中的TAG词添加链接等方法来为TAG页增加内链。关于外链,由于TAG词数量太多,所以不可能为每个TAG词都导入外链,但TAG词之间也肯定会通过站内搜索相关或语义相关,甚至按照数据库ID顺序平铺推荐的方式进行内部推荐,此时只需要按照一定的规则提取出部分有代表性的TAG词,如果结构上为这些TAG词导入外链可以惠及绝大部分TAG页面,那就为这些TAG词专门导入外链就可以了。

关于聚合,大家可以多关注一下美丽说,能直观地看出这是一个由各种聚合页组成的网站,并且没有传统导航、面包屑,“聚合”中的页面质量、内链搭建和技术细节有很多可以研究的内容。聚合”只是一种表现形式而已,SEO如果只关注关键词库及聚合本身就有些肤浅了。站在SEO的角度,要考虑到网站实际内容量和内容类型,以及关键词库的质量和词性分类等,站在网站运营和用户需求角度考虑的就是数据的二次萃取和挖掘了。

网站内容繁多,把用户最需要、最有价值的内容挖掘出来,以什么样的形式呈现给用户,这才是需要更深入研究的。SEO不要只停留在关键词和内容简单聚合的表层,还需要尝试着深入研究一下自身网站用户的直接、横向和纵向需求,以尽可能符合用户需求、尽可能丰富的形式为用户提供一种有价值的“聚合”。对于指定关键词,在指定文档中,往往词频越大的关键词越能反映文档的主题;

LEE在9月6日发布了《不相关静态搜索结果页将被严厉处理》的公告:

百度网页搜索反作弊团队近期发现一部分网站遍历热门关键词生成大量的站内搜索结果页来获取搜索引擎流量,其中存在大量的不相关内容严重损害了搜索引擎的用户体验并且侵占了相应领域的优质网站收益,对于此类网站我们将做出严厉的处理,希望存在此问题的站长及时进行整改调整。

这个问题已经存在很长时间了,其实和百度一直打击的垃圾TAG页面是一样的,TAG只是站内搜索的另一种展现形式而已。

客观来看,TAG页和站内搜索页都是一种很有价值的页面,在专业网站内,使用这种形式对网站内容进行二次萃取,把网站内容以聚合或专题的形式展现出来,让搜索用户可以更加快捷方便的找到和浏览自己需要的信息。百度原来也很青睐这种页面,因为这些页面可以在一定程度提升百度搜索结果的质量。

但是随着精明的SEO的介入,发现了这种页面更容易获得搜索排名和流量,进而使得这种页面大部分沦为了恶意抢夺搜索流量的垃圾页面。SEO们为了搜索流量,不顾关键词的质量以及自己网站是否有相关内容,而随意导入关键词和生成页面。并且为了加大页面和关键词的相关度,SEO们不是在

搜索结果相关度上想办法,而是把重心放在了人为堆砌关键词和导入锚文本链接上。SEO们不管词本身是什么,只要有搜索量(或指数),甚至只要是一个词,无论有没有搜索量,都直接导入站内,根据一定规则生成TAG或搜索结果页。由于词本身质量以及和网站定位相关性问题,再加上网站本身内容多少的问题,造成了今天很多网站都在使用这种方法制造垃圾页面的现象。

在此抛开LEE所给出的例子,来讨论一下这种原本优质页面在今天之所以会变为垃圾页面的根本原因:

1.关键词本身规范问题

SEO不管关键词的类型,都直接导入站内,使用统一的模板生成页面。比如有些网站会硬性把“电磁炉”“电磁炉图片”“电磁炉品牌”等词导入站内生成统一的搜索页面,但是搜索页面中只有内容的标题和发布时间,只是简单搜索,并没有给用户呈现“图片”“品牌”的相关内容。当网站中这种杂词量级达到一定程度,宏观上看,整个类型的页面都是垃圾页。

2.关键词和网站之间相关度问题

SEO不管关键词和网站之间的相关度,什么词都敢向站内导,比如手机网站可能导入了一些房产、旅游关键词,旅游网站可能导入了一堆美容、汽车或者工业关键词等,甚至有些正规内容网站导入了“买卖新娘”“济南人妖”等和自己完全不搭边的关键词。网站本身的定位和这些关键词就不搭边,网站内就更不可能有相关内容了,无论通过什么手段弄出来的页面的质量都不会好到哪儿去。

3.关键词数量和网站内容量平衡关系

SEO所收集处理的关键词类型以及关键词和网站内容相关性都比较好,但是没有事先检查网站的内容量是否足以支撑这些关键词。比如有的网站只有5W的内容,但是却导入了100万的关键词,即使关键词质量再好、关键词和网站主题再相关,用5W的内容去整合出100W的页面,那这些页面不是空页面(搜不出内容),那宏观来看就肯定有大量重复页面。从而导致整个类型的页面也都是垃圾页面。

4.站内搜索质量问题

有些网站可能把以上问题都解决了,在放出关键词之前也做了一步确定工作,确定用该关键词能搜出相关内容。但是网站站内搜索质量太差,导致所有聚合TAG或站内搜索页的内容和关键词本身很不相干,这并不是什么特殊的问题,大部分网站都会存在这个问题,“搜索”是一件很难的事儿,百度做了这么多年搜索,搜索结果还经常被大家吐槽,更何况其他非专业搜索公司做的“搜索”了。

但是既然想用“搜索”做一些事儿,那就要保证最起码的搜索质量,不要搜索“会计培训”而给出一堆“小吃培训”“Java培训”之类的内容。大部分网站的站内搜索如果自己没有比较强的技术团队,也没有第三方比较强的搜索技术支持,搜索结果的质量都不会很高,从而建立在低质站内搜索技术基础上的TAG和站内搜索页的质量也就不敢恭维了。由此做出的相关类型的页面也就被归到垃圾页面的行列中了。

以上从四个方面简单分析了百度所打击的TAG词页面和站内搜索页面垃圾化的原因,其实也就是解决了这些问题,再做出来的页面就不在百度的打击范围之内了,然而不同类型的网站在解决这四个问题时所需要做的工作都是不同的,需要大家各自想办法解决,这也算是SEO存在的一个价值吧。TAG词和站内搜索页都是质量很好的页面,但是这个“质量很好”是建立在网站内容量足够大和技术储备比较强的基础上的,很多中小型网站只意识到这种类型页面容易获得流量,但是并没有分析其他优质网站制作这些页面背后的工作,往往比着葫芦画瓢,最后遭受到了百度的惩罚。

不相关静态搜索结果页会受到严厉惩罚

部分网站遍历热门关键词、生成大量的站内搜索结果页来获取搜索引擎流量,其中存在大量不相关内容,严重损害了搜索引擎用户的搜索体验,并且侵占了相应领域的优质网站收益。百度质量团队明确表示:对于此类网站会做出严厉的处理。在上一篇《网站内容创作的大忌》中我们提到了“制作低质静态搜索结果页或TAG标签页”属于大忌,在此篇,我们把这个问题延展开来,提供更多的样例给各位参考。

样例一:页面主题为“在线行书字体转换器”,但该搜索结果页面中为各种商品列表,内容完全不相关。

定伟:百度如何处理不相关静态搜索结果页(搜索聚合页)

样例二:页面主题为“奇瑞开瑞优优油耗”,但页面搜索结果中各种主题的内容都有,完全不相关。

样例三:页面主题为“绿色软件下载吧”,但搜索结果中的内容并非围绕该主题的软件下载,完全不相关。

所以,虽然百度严厉打击这两种页面,但是网站并不是不可以继续使用这两种页面获得流量了,而是把内容和技术门槛提高了很多,让大家在关注各种流行的获取搜索流量的手法或产品时,也要深入的思考一下这些手段和产品背后的初衷和意义,而并不是为了搜索流量简单制造垃圾网页(中小站点也完全可以制作出高质的TAG页和站内搜索页,只要不触碰以上四个问题,搜索质量问题技术解决不了,完全可以依靠人工打标签的方式进行解决,根据网站自身规模和实力进行考量即可)。

同理,在百度打击垃圾外链的方面,也可以有类似的分析,大家可以根据自己的经验进行总结,并不要只是停留在单个链接本身是垃圾链接还是优质链接的表面问题上,其实大部分SEO问题都可以自己经过分析得到原因和答案。



分享到:


相關文章: