2014-11-21 66 views
0

当谷歌索引一个特定的html页面时,我怎样才能找出(任何语言,但如果Python更好)?Google是什么时候为一个网页编制索引的?

理想情况下,我会有一个网址列表来检查。

我已经尝试了WayBack机器,但它没有我需要的大部分页面。此外,如果任何人都可以建议API从文本中提取多种语言的日期。

回答

0

您可以使用此模式访问网页的缓存版本。

http://webcache.googleusercontent.com/search?q=cache:<URL> 

比方说,你可以看到我的博客datafireball.com的高速缓存版本的这个样子,你可以看到,它是索引20141020, 23:33:30strip=将避免加载JavaScript,css..etc。为了获得索引为索引的时间,可以使用一些浏览器自动化工具(如Selenium或Phantomjs等)来获取页面。

enter image description here

相关问题