2011-01-20 78 views
1

我会告诉你2种情况(注:d =阻尼因数= 0.5)的PageRank - 故障

第一种情形:假设有4个节点A, B, C, D:上A

  • B, C, D链接。

PageRank是: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

我可以把0.25PR(B)=PR(C)=PR(D)解决这个方程式,我会得到0.875as值。我不需要解决任何系统

第二种情况:假设有4个节点A, B, C, D

  • A链接BC
  • B链接C
  • C链接上A

这样的PageRank将是:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

我必须解决这个系统得到的结果。我不把1/NPR(A), PR(B), PR(C) and PR(D)

事实上,我互联网上搜索解决方案和值:

$ PR(A)= 14/13 = 1.07692308 $

$ PR( B)= 10/13 = 0.76923077 $

$ PR(C)= 15/13 = 1.15384615 $

因此,与两个相似的场景,为什么我用2个不同的行为呢?

希望有人能帮助我:)干杯

+1

不错的问题。但是,这与数学有关。 – shamittomar 2011-01-20 10:35:21

回答

1

的两种情况,因为在第一个问题的对称性是不同的:B,C和d链接,并从同一页面链接(即它们都指向A和没有指向他们)。因此,他们的页面排名将是相同的,这会给您额外的限制PR(B)= PR(C)= PR(D),使您能够轻松解决问题。

第二个问题没有对称性,需要长时间解决。

1

假设包含四个网页的小范围:A,B,C和D.从页面到其自身的链接或从单个页面到另一个单独页面的多个出站链接将被忽略。 PageRank初始化为所有页面的相同值。在PageRank的原始形式中,所有页面的PageRank总和是当时网页的总页数,因此本示例中的每个页面的初始PageRank都是1.但PageRank的较新版本和本节的其余部分假设0到 之间的概率分布1.因此,每个页面的初始值为0.25。

在下一次迭代时,PageRank从给定页面转到其出站链接的目标,并在所有出站链接之间平均分配。

如果系统中唯一的链接是从页面B,C和D到A,那么每个链接将在下一次迭代时将PageRank传递给A,总计为0.75。

PR(A)= PR(B)+ PR(C)+ PR(d)

假设代替该网页B具有一个链接到网页C和A,页C具有一个链接到页A,和页面D有链接到所有三个页面。因此,在下一次迭代时,页面B将其现有值的一半(或0.125)转移到页面A,将另一半(或0.125)转移到页面C.页面C将将其全部现有值0.25转移到唯一它连接到的页面A.由于D有三个出站链接,它会将其现有值的三分之一(约0.083)转移到A.在此迭代完成后,页面A的PageRank将为0.458。

PR(A)= \压裂{PR(B)} {2} + \压裂{PR(C)} {1} + \压裂{PR(d)} {3}。\,

换句话说,出站链接赋予的PageRank等于文档自己的PageRank分数除以出站链接数L()。 PR(A)= \ frac {PR(B)} {L(B)} + \ frac {PR(C)} {L(C)} + \ frac {PR(D)} {L d)}。

在一般情况下,对于任何网页的PageRank值u可以表示为:

PR(U)= \ sum_ {在B_u v \} \压裂{PR(V)} {L(V )},

即页面u的PageRank值取决于包含在集合Bu(包含所有页面链接到页面u的集合)中的每个页面v的PageRank值除以数量L(v)来自第v页的链接

For further queries visit here