2013-05-11 107 views
0

我一直在尝试从http://osu.ppy.sh/u/2330158下载html以获取历史数据 ,但它不下载该部分。它也下载一般,顶级等Wget下载html

有没有办法让wget下载它?

+0

通过ajax加载部分内容的网站并不容易通过wget获取。也许你可以开始使用硒。 – luksch 2013-05-11 10:42:21

回答

2

页面的这一部分是动态加载的,所以wget不会看到它,因为它不支持Javascript。但是,如果您在选择的浏览器中打开Web开发人员工具,然后加载主页面,则可以获取您真正关注的URL。对于这个页面,它是:http://osu.ppy.sh/pages/include/profile-history.php?u=2330158&m=0

幸运的是,这是另一种简单的,参数化的URL,因此你可以说给wget:

wget "http://osu.ppy.sh/pages/include/profile-history.php?u=2330158&m=0" 

那你拿一个仅包含你的历史数据的HTML文档寻找。

+0

谢谢你的chooban! – Mikiku 2013-05-11 11:11:14

+0

如果他的答案令人满意,你应该考虑接受答案,并考虑提高答案。 – luksch 2013-05-11 11:41:33

+0

这两种行为都很可爱! :) – chooban 2013-05-11 12:03:26