2010-07-10 86 views
0

我正在构建新闻聚合网站,并且正在寻找将任何特定网站的旧订阅源提取到系统中的方法。在这个过程中,我偶然发现了Feedjack。据说它处理我所需要的。于是我开始潜入源代码。 (我不想在我的Django项目直接plugit)。我看到的是这一行:FeedJack如何获取历史订阅源

self.fpf = parse_feed(self.feed.feed_url, agent=USER_AGENT, etag=self.feed.etag) # in bin/feedjack_update.py 

我不知道如何处理历史饲料解析。我可以知道我错过了什么吗?我还有一个问题,更别说feedjack了,我如何访问任何网站的历史提要?

回答

0

从网站不提供历史订阅源。不幸的是,“访问”它的唯一方法是将它自己存储在数据库中。对于常见的Feed,您可能能够从另一个聚合器获取它。否则,您会从第一次添加订阅源开始建立历史记录。

0

我能看到的唯一选择是使用Google阅读器。有一个blogpost about constructing feed history of any feed。我不想坚持只获取历史饲料的服务。无论如何,如果没有更好的选择,我会为此而努力。

+0

我阅读了上述谷歌阅读器blogpost中的评论,并试用了NewsBlur.com。两者似乎都以同样的方式失败,除非有人订阅该网站已经至少一次,否则你不能保证旧的收费。所以谷歌阅读器只是提取已经缓存的条目。如果没有人订阅了该网站,那么它的缓存中就没有任何内容,并且您无法从此Google阅读器平台中检索它。游戏结束! – 2010-07-21 02:33:54