2016-04-15 76 views
-1

我试图提取使用rvest从烂番茄Rvest:为什么下面的XPath返回空列表

我用下面的代码的标题:

urlhtml<-read_html("http://www.rottentomatoes.com/browse/opening/") 
df<-html_text(html_nodes(urlhtml,xpath="//*[@id='movies-collection']/div/div/div[2]/a")) 

xpath从谷歌浏览器,从而派生我相信这是正确的,但是,它返回空列表...我无法弄清楚什么是错的。

任何人都可以帮忙吗? 非常感谢

+0

确定的元素是存在的文档中,你获取或他们可以动态添加后来的JavaScript? –

+0

我不是网络编程方面的专家,但我确实看到了HTML检查中的元素,所以我相信他们不使用javascript – Aiji

+0

@RogerLindsjö,有无论如何我可以检查这种情况,如果它是由javascript动态添加的?如果是这样的话,我能做些什么来刮取数据?你能分享你的知识吗? – Aiji

回答

0

谢谢大家,原来像@RogerLindsjö说,我需要一个JavaScript首先解析HTML和使用phantomjs合作[R报废

相关问题