SEO网站权重,PageRank算法研究
发布时间:2008-11-12
搜索引擎经过这几年的发展,算法已经变的相当成熟。特别是Google排名算法,更是全球SEOER热衷的研究对象。搜索引擎优化行业的门槛,也变的越来越高。
在之前关于网站权重讨论的几篇文章之中,更为适用于Web搜索引擎的个性化PageRank方案是利用添加修正参数来计算个性化PageRank值。这个方法较前者而言,不要求全面获取Web资源的使用情况,所以无需过多地在遍历网页结构时重新定义不同超链的权重分配关系。与此相反,该方法只需要在得到全部网页的简单超链结构关系后,直接通过引入修正参数来体现用户的个性化特征信息。
这种引入修正参数的方式可以适用于多种特殊情况下的PageRank值计算要求。,可以表达个性化用户特征,改变传统PageRank公式中仅仅使用同一个标准权重初始值来设置全部网页的起始权重,而且在网页随机跳转因子的设定上也存在忽视用户个性化需求的特点;第二,还可以利用修正参数来反映主题化的PageRank网页权重值。传统的PageRank方法在计算每个网页具体的重要性权值时根本没有考虑到任何网页本身内容特征对权值的影响,完全忽略了网页具有不同的主题。事实上,不同的网页在不同的主题要求下应该具有不同的重要性权值。也就是说,在用户查询的时候,网页重要性权值的大小与查询所表达的主题关系很大。其实,在HITS算法中恰恰考虑了这种因素,所以它更易于表达与特定查询主题相关的相关度排序,有效地在PageRank算法中考虑查询主题对网页权重值的影响是一个有效改进此算法的重要方法.同时,这种主题化的PageRank计算方法也能通过相同网页的不同主题化PageRank值来表现用户的个性化需求。最后,这种方法还可以解决一些其他问题,如传统PageRank算法没有考虑网页的创建时间对网页权重的影响程度,也不对新旧网页进行有效的区分,相反,按照PageRank的既有算法甚至会产生旧网页具有比新网页具有较高重要性权值的可能性。
从实质上看,解决上述几个问题具有相似的处理方式,那就是对传统PageRank算法中的很多参数设定不再使用单一的值,相反,这些值要能充分体现主题差异和用户的个性化差异。
在之前的文章中,我们已经得到基于关键词访问序列的用户事务聚类模式,也就是说,每个访问用户都会对应若干个不同聚类模式。所以,好的考虑是利用已有的聚类模式来计算各个不同模式所对应的网页PageRank值,同时在用户查询时,就可以直接利用用户所属聚类模式对应的PageRank值来对网页进行相关度排序,这样既可以加快查询时的运算速度,同时也能充分考虑用户的个性化特点。
相关的文章还有:
2.SEO网页质量
搜索引擎经过这几年的发展,算法已经变的相当成熟。特别是Google排名算法,更是全球SEOER热衷的研究对象。搜索引擎优化行业的门槛,也变的越来越高。基础性的SEO技巧例如:描述标签优化、网页标题优化、关键字优化等,作用越来越小。要实施搜索引擎优化项目,更加需要策略、系统、战略性思维。