2009-04-24 83 views
3

的学位,我可以使用哪些准备提供算法,数据挖掘Twitter要找出2人在Twitter之间的分离度。Twitter的数据挖掘:分离

当社交图谱不断变化和不断更新它是如何改变。

,然后在那里我可以使用,而不是让这么多的API调用来重新开始的Twitter社交图的任何数据转储。

回答

0

有提供对社交图谱的转储一个公司,但它记录下来,并不再可用。正如你已经意识到的那样 - 这有点困难,因为它一直在变化。

我会建议您检查出他们social_graph API方法,他们给用最少的API调用最为信息。

5

Twitter API

What's the Data Mining Feed and can I have access to it?

The Data Mining Feed是我们/状态/ public_timeline REST API方法的扩展版本。它返回600个最近的公共状态,一次缓存一分钟。您可以每分钟申请一次,以获取Twitter上公共状态的代表性样本。我们为研究人员和业余爱好者提供免费服务(并且不提供服务质量保证)。我们所要求的是,您提供了您的研究或项目的简要说明以及您要求提供此源的IP地址;只需填写此表格。请注意,数据挖掘Feed并非旨在提供Twitter上所有公共更新的连续流;请参阅上文以获取有关即将推出的“firehose”解决方案的更多信息。

,也看到:Streaming API Documentation

+0

的权利..但是..算法? – Bluu 2009-04-25 18:59:45

0

有可能是做这件事的其他方式,但我刚刚花了近10分钟时间浏览做类似的东西和这Q.跌跌撞撞

我会用一个无向(&加权 - 因为我想要的查看位置)图 - 在py中使用JgraphT或类似; JGraphT是基于Java的,但包含不同的预写算法。

然后,您可以使用名为BellmanFord算法;需要一个整数输入,并在图中搜索具有整数输入的最短路径,并且只有整数输入,与Dijkstras不同。

http://en.wikipedia.org/wiki/Bellman%E2%80%93Ford_algorithm

我最近用它在飞行路径的一个项目,迭代高达找到最短的最短路径“跳”(边缘)。