我使用HtmlUnit从动态网页抓取数据,动态网页使用无限滚动来动态抓取数据,就像Facebook的新闻源一样。我用下面的语句来模拟向下滚动事件:使用htmlunit抓取动态网页
webclient.setJavaScriptEnabled(true);
webclient.setAjaxController(new NicelyResynchronizingAjaxController());
ScriptResult sr=myHtmlPage.executeJavaScript("window.scrollBy(0,600)");
webclient.waitForBackgroundJavaScript(10000);
myHtmlPage=(HtmlPage)sr.getNewPage();
但似乎myHtmlPage保持与前一个,即新的数据没有myHtmlPage附加相同的,因此我只能抓取第一网页上的数据很少。谢谢你的帮助!
你找到了解决办法? –
任何解决方案? –
也在寻找解决方案。任何结果? – lummycoder