在理解搜索引擎的算法上,尤其是对于像谷歌这样的超级系统来说,低估或称简单化其原理是绝不可取的。Google对于网页权重的权衡是根据多方面因素综合判定的结果,关键词只是诸多因素的一个方面,而即使是这一个方面也并不是简单的关键词所能概括的,这其中还包括对相关词汇的权衡。
对于某个网页来说,当我们仅用某个关键词的堆砌来试图引诱Google的注意,从而获得这个关键词在谷歌中的优化时,Google的注意力并不仅仅只集中在这个关键词上,它要分析在这个网页中是否有与这个关键词相关联的词语的信息,如果有则Google会认为该页对于这个关键词来说是饱满的,也就是说这个网页提供了实质的而并非空洞的内容。空说乏味,下面实例说明:
1、“音乐”这个词在搜索引擎中应该算是个热词了。与音乐相关联的词有:听、歌曲、mp3、下载、试听等等,其中的一些是当初搜索引擎系统初建时设定的,更多的则是Google在日后的不断索引过程中逐渐学习到的,比如:mp3、下载和试听。Google蜘蛛在长期的爬网过程中,在包含“音乐”的网页中总结了一定的定式,即凡是涉及音乐的网页,多可找到包含“mp3”字样的链接地址,在网页中多含有“试听”和“下载”这样的关键词,在网页的源代码中常出现类似于“ <embed src="文件地址" showstatusbar="1" autostart="0" loop="1" /> ”这样的播放器代码,甚至是一些诸如“320kbps”这样的词也会被考虑到。这些相关词由谷歌采集于网络,同时也参与Google对相关词的校正,是一个相互融合、相互影响的过程。Google通过这样的算法使得我们在以“音乐”为检索词在Google中搜索时,返回更有实质意义的页面,而不是毫无意义的网页。在针对某个关键词的网页权重上,只有关键词和相关词在某个网页上搭配合理时才会被Google赋予较高的权重(当然在这里并未将其他影响网页权重的因素纳入)。有时,当一个网页中只有相关词而没有关键词时,由于这些关联词搭配合理,Google很有可能按照这个缺如的关键词来索引该网页并赋予一定的权重。这样的特例往往更具有说服力,从而让大家认真考虑相关词在网页布局优化上的重要性。
一个特例:
请在Google搜索框中输入“ mp3 ”,并回车执行搜索,在返回的结果页面可以看到“爱问音乐搜索”这个网页链接,在该页面找不到任何“mp3”这个关键词的字样,但是在该页面上相关“mp3”的关联词却非常之饱满:流行金曲、经典老歌、新歌快递、青花瓷、周杰伦、张韶涵、刘德华等等。网页下方的播放器链接更突出了该页与“mp3”的相关性。因此像这样一个不含有关键词的网页由于其相关词的突出表现而被Google排在前面就不足以为奇了。这样的好处是使得该页同时在两个关键词(mp3和音乐)排位上均有不俗的表现,同时网页标题简洁大气,彰显门户网站之风度,堪称网页优化的典范。
近年来,Google正越来越重视相关词算法的研究与革新,网上可以搜到一篇名为“Google向以色列学生购买新搜索算法”的文章来了解Google在这方面更进一步的动向。同时,一些带有相关词分析功能的新型搜索引擎的出现,也刺激了谷歌这方面的神经。搜索引擎 - clusty就是一个典型的例子。