2016-11-21 78 views
0

我想用readHTMLTable读R中的HTML表格。对于我的查询,它返回一些但不是全部的表格。实际上,如果我不指定(“which =”)它可以读可以的表,它会失败。任何帮助,将不胜感激。阅读R中的HTML表格

Q<-paste0("http://www.hockey-reference.com/leagues/NHL_2016.html") 

A<-readHTMLTable(Q, which = 1:2, stringsAsFactors = FALSE) 

按预期返回两个数据帧的列表。有,但是,在此页面上readHTMLTable似乎无法识别的几个表:

A<-readHTMLTable(Q, which = 3, stringsAsFactors = FALSE) 

A<-readHTMLTable(Q, stringsAsFactors = FALSE) 

都返回:
错误UseMethod( “xpathApply”): 不适用方法'xpathApply'应用于类“NULL”的对象

回答

0

谢谢。这是一个改进,但它仍然不会返回所有表格。在这种情况下,它返回前18个表格,但还有更多。

这里是从同一网站

dat <- read_html("http://www.hockey-reference.com/teams/NYR/2016.html") %>% 
    html_table(fill=TRUE) 

当有几个更它返回第一4代表的列表的类似病例。