2010-04-02 79 views
1

有没有办法抓取所有Facebook粉丝页面并收集一些信息?比如抓取Facebook粉丝页面并保存他们的名字,或者有多少粉丝等等?或者至少,你有没有提示如何做到这一点?是否有抓取所有Facebook粉丝页面的方法?

+0

在那里,做到了(嗯,不是我,但你明白了)。在抓取Facebook之前,您可能需要考虑法律问题:http://slashdot.org/story/10/03/31/1430256/Facebook-Kills-Dataset-of-Crawled-Public-Profiles – 2010-04-02 06:08:05

回答

2

写一个履带式的。

+0

RE:Stephen:你能否详细解释一下你的回答?我不是最流利的程序员,但希望能够将链接导出到乐队所有粉丝的配置文件中,并将其导入到csv文件中。你能否解释一下你如何解析“粉丝”分隔线并查看它的来源?另外 - 你如何解析出粉丝,然后解析出下一页的链接? – nicktendo 2010-06-22 18:22:23

1

下载并运行websphinx jar。输入http://www.facebook.com/pages/以启动网址并选择子树作为抓取。不要忘记增加页面大小和页面超时值。线程的数量越多(100-200)越有可能成功爬取更多页面。

+0

http://www.facebook.com/pages/列出'建议页面','喜欢的页面'。我没有看到获得其他页面链接的方法。一种方法是抓取朋友喜欢的页面。有什么建议么? – ankshah 2016-05-02 17:21:17