2011-09-27 96 views
0

我需要为给定的一组关键字提取twitter历史数据。 Twitter搜索API返回的推文不超过9天,因此不会这样做。我目前正在使用Tweepy Library(http://code.google.com/p/tweepy/)来调用Streaming API,并且它工作正常,除非它太慢。例如,当我搜索“$ GOOG”时,有时两个结果之间需要一个多小时。肯定有包含该关键字的推文,但它不够快返回结果。有没有更好的方法通过python访问Twitter流api?

可能是什么问题? Streaming API速度缓慢还是我的访问方法存在一些问题?有没有更好的方法来免费获得这些数据?

回答

1

你需要多久?要获取历史数据,您可能希望无限期地保持流(流API允许)并在本地存储流,然后从数据库中检索历史数据。

我也使用Tweepy进行直播/过滤,效果很好。延迟时间通常为1秒,Tweepy能够处理大容量流。

0

流式传输API速度太快,只要您发布它,我们就会使用twitter4j。但流式传输只能传输当前消息,因此,如果您在发送推文的时刻不收听流式传输,那么消息就会丢失。

相关问题