我不得不开始使用Selenium作为一个网站,我爬了已更新为JavaScript,在寻求一些建议后,硒在这种情况下被推荐为选择的程序。如何使用硒选择不同的元素?
使用Selenium我现在可以抓取网站并“大致”得到我想要的,但我希望获得关于如何选择我在抓取表格时收集的不同元素的指导。 例如,当我使用J-汤来收集数据,我得到了整个表所示:
docVTS = Jsoup.connect("http://********************").timeout(10000).get();
Elements table = docVTS.select("table.dynlist");
然后我可以收集该表的不同部分是这样的:
Elements number = table.select("td:eq(0)");
vtsInt = number.size();
for (int i = 0; i < vtsInt; i++) {
ships = table.select("td:eq(1)").get(i).text().replace(" ","");
arr_ships.add(ships);
dwt = table.select("td:eq(3)").get(i).text().replace(" ","");
arr_dwt.add(dwt);
是Selenium可以做到这一点吗?
我目前有:
String text = driver.findElement(By.xpath("//div[@id='cphBody_Report_grid']")).getText();
这得到了表,但我不能确定为像我在J-汤做的,我可以如何选择表的不同部分。 我欢迎任何建议。谢谢。
编辑:我发现这个食谱的硒和一般的选择,并发现它有用,而硒启动时:https://www.simple-talk.com/dotnet/.net-framework/xpath,-css,-dom-and-selenium-the-rosetta-stone/
为什么不使用Jsoup解析,等你以后浏览的页面与硒(如果你已经熟悉Jsoup?)的答案 – user2272115 2014-11-03 00:16:01