有没有办法抓取所有Facebook粉丝页面并收集一些信息?比如抓取Facebook粉丝页面并保存他们的名字,或者有多少粉丝等等?或者至少,你有没有提示如何做到这一点?是否有抓取所有Facebook粉丝页面的方法?
回答
首先选择包含网页所需种类的页面:
例如:http://www.facebook.com/pages/或http://www.facebook.com/pages/?browse&ps=93
然后用履带式来获取所有页面的链接。
现在,您可以使用提取的链接分别解析每个页面。
您可以使用simple html dom进行抓取。
写一个履带式的。
我用可口可乐的网页作为一个实验:http://www.facebook.com/cocacola?v=wall
解析出“粉丝”的div,其中包含一个“所有球迷的”链接。在Web浏览器查看源代码,它看起来像这样: /social_graph.php?node_id=40796308305 &类= FanManager
把它转换成一个网站的网址和抓取: http://www.facebook.com/social_graph.php?node_id=40796308305&class=FanManager
解析出粉丝,然后解析出“下一页”链接。
重复,广告恶心。
调整您的请求,让facebook不会将您列入黑名单。
RE:Stephen:你能否详细解释一下你的回答?我不是最流利的程序员,但希望能够将链接导出到乐队所有粉丝的配置文件中,并将其导入到csv文件中。你能否解释一下你如何解析“粉丝”分隔线并查看它的来源?另外 - 你如何解析出粉丝,然后解析出下一页的链接? – nicktendo 2010-06-22 18:22:23
下载并运行websphinx jar。输入http://www.facebook.com/pages/以启动网址并选择子树作为抓取。不要忘记增加页面大小和页面超时值。线程的数量越多(100-200)越有可能成功爬取更多页面。
http://www.facebook.com/pages/列出'建议页面','喜欢的页面'。我没有看到获得其他页面链接的方法。一种方法是抓取朋友喜欢的页面。有什么建议么? – ankshah 2016-05-02 17:21:17
- 1. 抓取Facebook粉丝页面
- 2. 获取我的Facebook粉丝的所有粉丝页面
- 3. 是粉丝的Facebook页面?
- 4. 获取Facebook页面粉丝?
- 5. 获取Facebook页面粉丝
- 6. 用户名/所有者粉丝页面ID(Facebook粉丝页面应用程序)
- 7. 从Facebook页面获取粉丝页面
- 8. Facebook粉丝盒粉丝页
- 9. 带粉丝门的Facebook粉丝页是否被Google索引?
- 10. Facebook粉丝页面调整
- 11. 创建Facebook粉丝页面
- 12. Facebook粉丝页面提要
- 13. Facebook粉丝页面订阅
- 14. Facebook粉丝页面互动
- 15. Facebook:获取粉丝页
- 16. 如何判断用户是否为粉丝页面的粉丝
- 17. 有一种方法可以通过Facebook的C#SDK在粉丝专页中标记粉丝页面吗?
- 18. 获取用户拥有/管理的Facebook粉丝页面
- 19. Facebook的粉丝页面:有没有一种方法可以使用图形API获取Facebook粉丝页面的描述
- 20. 检查用户是否是我的Facebook页面的粉丝
- 21. 检查用户是否是我的Facebook页面的粉丝?
- 22. Facebook的页面有一个粉丝或不是
- 23. 使用Facebook图表获得粉丝页面的粉丝?
- 24. Facebook:确定用户是否是粉丝(喜欢页面)
- 25. 检测用户是否喜欢Flash中的Facebook页面(粉丝)
- 26. 如何从Facebook粉丝页面发布到粉丝墙?
- 27. 在Facebook粉丝页面添加粉丝框
- 28. Facebook粉丝页面问题:如何发送邮件给粉丝?
- 29. Facebook粉丝页面 - 邀请粉丝参加活动
- 30. 隐藏Facebook粉丝页面视频标签不粉丝
在那里,做到了(嗯,不是我,但你明白了)。在抓取Facebook之前,您可能需要考虑法律问题:http://slashdot.org/story/10/03/31/1430256/Facebook-Kills-Dataset-of-Crawled-Public-Profiles – 2010-04-02 06:08:05