我不想只是源代码。我想要呈现的页面。这是我通过简单搜索Google显然无法做出的重要区别。我如何从一个URL提供网页页面?
有谁知道我可以从一个URL获得呈现页?
这需要用Java做的,希望没有额外的库。
我不想只是源代码。我想要呈现的页面。这是我通过简单搜索Google显然无法做出的重要区别。我如何从一个URL提供网页页面?
有谁知道我可以从一个URL获得呈现页?
这需要用Java做的,希望没有额外的库。
您可以尝试使用包装Web浏览器的库,例如Berkelium。如果你需要在Java中,谷歌搜索产生this Java wrapper API for Berkelium(我没有亲自尝试过)。
sites.google有其使用的example:
另一种解决方案将是使用HTMLUnit
这是一个“为JAVA GUI的浏览器少”。 Google建议生成基于ajax的网页的快照以使其可抓取。
我有点困惑。这看起来像是一个JUnit测试。我对吗? – nub 2012-07-18 21:54:26
它可以用于单元测试是的,但它也可以用来获取呈现的HTML页面(快照)。我一直在使用Ajax的网站上工作,HTMLUnit允许我生成我输出的网页快照,以使网站可以抓取。 [This](https://developers.google.com/webmasters/ajax-crawling/docs/html-snapshot)页面显示了如何在页面底部的第3点使用HTMLUnit生成快照的示例。希望这可以帮助! – 2012-07-19 15:41:53
使用浏览器访问的网址? – hvgotcodes 2012-07-18 21:15:35
@hvgotcodes ha。哈。 – nub 2012-07-18 21:28:12