搜索PageRank网页排名技术
目录
搜索:PageRank网页排名技术
搜索结果的排名取决于两组信息:关于网页的质量信息,以及这个查询与每个网页的相关性信息。
PageRank算法的原理
一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,排名就高。
对于不同网页的链接区别对待,排名高的网页链接更可靠,这些链接的权重就更大。
但这里,存在网页排名过程需要用到网页本身的排名,因此,可以使用迭代的方法。
先假设所有网页的排名是相同的,根据初始值,算出各个网页的第一次迭代排名,然后不断迭代直到收敛。
由于网页的数量比较多,描述这个邻接矩阵很巨大,因此,使用稀疏矩阵计算的技巧,简化计算量,实现网页的排名算法。