我试图让我的脑海里围绕一个与MapReduce实现PageRank的理论有关的问题。使用MapReduce实现PageRank
我有三个节点下面的简单情形:AB C.
邻接矩阵是在这里:
A { B, C }
B { A }
对于B例如中的PageRank等于:
(1-d)/N + d (PR(A)/C(A))
N = number of incoming links to B
PR(A) = PageRank of incoming link A
C(A) = number of outgoing links from page A
我很满意所有的原理图以及mapper和reducer是如何工作的,但我不知道C(A)在计算时如何知道C(A)。在通过将传入链接聚合到B来计算B的PageRank时,缩减器将如何知道每个页面的传出链接的数量。这是否需要在某些外部数据源中查找?
可能可以得到更好的答案:http://cstheory.stackexchange.com/ – Orbling 2011-02-17 13:18:30