是的,这只是另一个“如何刮”问题。对不起,但我也读过以前的答案和rvest
的手册。rvest Webscraping hltv
我正在做我的家庭作业的网络抓取(所以我不打算使用任何商业问题的数据)。这个想法是表明团队的平均技能影响个人技能。我正在尝试使用来自HLTV.org的CS:GO数据。
的信息,请http://www.hltv.org/?pageid=173&playerid=9216
我需要两个表:Keystats(仅数据)和队友(数据和URL)。我尝试使用SelectorGadget生成的CSS选择器,并尝试分析网页的源代码。我失败了。我正在做以下事情:
library(rvest)
library(dplyr)
url <- 'http://www.hltv.org/?pageid=173&playerid=9216'
info <- html_session(url) %>% read_html()
info %>% html_node('.covSmallHeadline') %>% html_text()
你能告诉我这是正确的CSS选择器吗?
该网站是否允许自动抓取? – GGamba