2012-01-05 105 views
0

我正在使用Selenium自动加载纽约时报文章的所有评论。一旦他们被加载,我想获得评论并存储该信息以便以后使用。但是,在查看文章的源代码时,我发现注释DIV是空的,所以NYT可能会使用javascript实时动态填充注释。由于注释并不在源代码中,因此我不确定如何在Firebug中看到注释的代码。我认为,我想要的是DOM,但任何帮助将不胜感激!使用Selenium获取已填充javascript的DIV的内容

谢谢!

+0

使用Web驱动程序?你弄清楚他们是如何加载它的?它依靠滚动位置吗? – epascarello 2012-01-05 22:20:08

+0

使用IDE,但我想我可能需要切换到Web驱动程序用于这些目的。不知道他们是如何加载的,但我的教授认为它可能与JavaScript。滚动位置似乎不成问题。 – olivebeq 2012-01-06 15:16:48

回答

0
var content = document.getElementById('myDivId').innerHTML; 

这基本上是如何从HTML元素中检索html内容的。

+0

不会帮助硒。 – epascarello 2012-01-05 22:19:37

+2

@epascarello:为什么不呢?你总是可以使用Selenium的'getEval'方法在页面上执行那段JavaScript。 – slebetman 2012-01-06 02:33:31

+0

为什么在构建获取内容的方法时使用getEval? – epascarello 2012-01-06 15:29:30