PageRank Sampling Iterative 源码

timely65323 7 0 ZIP 2021-04-19 05:04:46

PageRank(采样,迭代) 背景 当Google之类的搜索引擎显示搜索结果时,它们会通过在搜索结果中放置比不那么重要的页面更高的“重要”页面和更高质量的页面。 但是搜索引擎如何知道哪些页面比其他页面更重要? 一种启发式的想法可能是“重要”页面是许多其他页面链接到的页面,因为可以合理地想象到,与质量较低的页面相比,更多的站点将链接至质量较高的页面。 因此,我们可以想象一个系统,其中根据每个页面从其他页面获得的传入链接的数量为每个页面赋予一个等级,并且更高的等级将发出更高的重要性。 但是这个定义并不完美:如果某人想让自己的页面看起来更重要,那么在此系统下,他们可以简单地创建许多其他页面,这些页面链接到所需页面,从而人为地提高了其排名。 因此,PageRank算法是由Google的联合创始人创建的(包括为其命名算法的Larry Page)。 在PageRank的算法中,如果一个网站被其

用户评论
请输入评论内容
评分:
暂无评论