目录

搜索PageRank网页排名技术

目录

搜索:PageRank网页排名技术

搜索结果的排名取决于两组信息:关于网页的质量信息,以及这个查询与每个网页的相关性信息。

PageRank算法的原理

一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,排名就高。

对于不同网页的链接区别对待,排名高的网页链接更可靠,这些链接的权重就更大。

但这里,存在网页排名过程需要用到网页本身的排名,因此,可以使用迭代的方法。

先假设所有网页的排名是相同的,根据初始值,算出各个网页的第一次迭代排名,然后不断迭代直到收敛。

由于网页的数量比较多,描述这个邻接矩阵很巨大,因此,使用稀疏矩阵计算的技巧,简化计算量,实现网页的排名算法。

https://i-blog.csdnimg.cn/blog_migrate/8f0ad12f6f19e3fb3dd978a1c3536397.png#pic_center

https://i-blog.csdnimg.cn/blog_migrate/7c08f7a22000c5c1f8dc1798a4569fce.png#pic_center