2010-02-27 50 views
0

是否有API(Twitter API不提供此功能),例如,我可以使用它来确定200条推文中最常见的链接。我想要做的是获得最新的200条推文,然后确定人们在讨论什么,我确信推文将包含链接(因为我会要求twitter API返回只包含链接的推文),但我也会希望确保我的代码能够理解两个URL是相同的,即使它们有不同的bit.ly链接。是否有API来确定许多推文中最常见的链接?

我想要做的事情(这可能会让你的家伙更容易提供一些帮助)是,我正在试图确定人们在这200条推文中最重要的主题是什么。我明白,人们可能会谈论同样的故事,但提供不同的链接,但是,我不确定是否有一种简单的方法来理解这一点。

链接的例子,原料药,示例代码,和任何其他的想法会有所帮助:)

如果你需要更多信息来解释这个请告诉我,我会编辑的问题,包括更多信息

回答

2

不,我知道的,但你可以做到这一点..

  1. 找到所有使用正则表达式模式鸣叫列表的链接。

  2. 使用twitter搜索API来搜索每个链接。返回结果数量。

  3. 通过返回的结果手动对链接进行排序。

0

从根本上说,你可以从API得到这个,先获取最新的公共时间表(这将是100个微博,如果你需要200则需要请求游标并创建一个循环,如果next_cursor值检查大于0),然后构建一个决定相关性的蜘蛛。

http://api.twitter.com/1/statuses/public_timeline

其中???是json,xml,rss或原子

如果要确定单词的流行度,请将所有文本转储为字符串,然后将其分割为空格,标点符号等,丢弃非名词,对其进行排序并创建字典随着单词和单词的数量而变化。

如果你想确定链接的流行性,那么它是相同的过程,但有一个额外的步骤来做每个链接上的Web请求,以确定最终的链接目的地。

0

建立在别人的说法上,你可以使用twitter搜索来获取推文没有问题,我不会在这个答案中进入那部分。

为短链接一种可能途径:

,你可以,例如,转到bit.ly和创建自定义短链接,你想跟踪的网址。如果您在网址的末尾添加+,则可以使用该链接获取链接统计信息。例如:http://bit.ly/tweelay+此外,bit.ly会跟踪指向相同url的其他短链接。你可以在你的搜索中使用它。

使用bit.ly /stats API您可以获取缩短的网址列表。

根据您试图追踪您的网址,您可能有权访问引荐日志。 (即您自己的网站)使用您的推荐日志,您还可以找到可用于搜索的其他短网址。