我一直在试图使用selectorgadget在R的特定网站的webscrape数据。例如,我成功地从http://www.dotabuff.com/heroes/abaddon/matchups webscraped之前。通常,我只需使用selectorgadget Chrome扩展单击我想要的表格,并将CSS选择结果放入代码中,如下所示。如何使用selector(Rvest)使用selectorgadget来webscrape .dpbox表?
urlx <- "http://www.dotabuff.com/heroes/abaddon/matchups"
rawData <- html_text(html_nodes(read_html(urlx),"td:nth-child(4) , td:nth-child(3), .cell-xlarge"))
在这种情况下,html_nodes函数确实返回节点的一大堆(340)
{xml_nodeset (340)}
然而,当我尝试webscrape关闭http://www.dotapicker.com/heroes/Abaddon使用selectorgadget,这原来是这个代码:
urlx <- "http://www.dotapicker.com/heroes/abaddon"
rawData <- html_text(html_nodes(read_html(urlx),".ng-scope:nth-child(1) .ng-scope .ng-binding"))
不幸的是,没有节点实际上html_nodes函数被调用后显示出来,而我得到的结果
{xml_nodeset (0)}
我觉得这与表格嵌套在下拉框中有关(与之前相比,表格在网页本身上是正确的),但我不确定如何绕过它。
谢谢,我感谢任何帮助!