2016-04-28 124 views
0

我在尝试从网页解析财务表。我继续。但我不能够安排名单,或data.frame从R,Rvest,Rcurl从网页中刮取财务表

library(rvest) 
link <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter" 
read <- read_html(link) 
prs <- html_nodes(read, ".financials") 
irre <- html_text(prs) 
re <- strsplit(irre, split = "\r\n") 

re是这样的:

[27] “资产”
[28] “”
[29] “”
[30]“”
[31]“所有值TRY百万。”
[32] “31日 - 12月201431-MAR-201530君201530九月201531-DEC-2015”
[33] “5-QTR趋势”
[34] “”
[35 ] “”
[36] “”
[37] “”
[38] “总现金&由于从银行”
[39] “27.26B26.27B26.7B34.51B27.9B”
[ 40]“”
[41]“”
bla bla ...

我如何通过data.frame编辑此列表,妥善这样page

回答

0

尝试

library(XML) 

theurl <- "http://www.marketwatch.com/investing/stock/garan/financials/balance-sheet/quarter" 
re <- readHTMLTable(theurl) 

结果是有两个dataframes列表。

+0

固定。谢谢!! –