2010-10-23 86 views
7

我想谷歌缓存中进行搜索,所以我需要触发此查询:任何API来搜索谷歌缓存?

http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news 

并获得像从页面时间戳的一些内容。但是,当我使用curl(ruby)来执行此操作时,它会给出拒绝许可权限的错误,即阻止并预期会发生刮擦。

那么,有没有什么办法可以搜索谷歌的缓存(或API或某种变通刮),并提取样时间戳的一些信息?

回答

2

我没有得到任何API,但我可以在轨道中使用hpricotnokogiri刮(Rails中的curl给予权限被拒绝错误)。一旦我弄清楚如何使用这些宝石从上面的URL中提取时间戳,我就会提供代码。

任何一个有一个更好的解决办法?