我有一个像this one这样的链接,我想使用RCurl
从它提取数据,在此之前有一个免责声明页面,我需要在我的浏览器中单击它然后才能评估数据。以前我用下面的脚本,这是从here,以“搭桥”的免责声明页并访问使用RCurl
数据:使用RCurl绕过“免责声明页面”,然后做网络报废
pagesource <- getURL(url,.opts=curlOptions(followlocation=TRUE,cookiefile="nosuchfile"))
doc <- htmlParse(pagesource)
它的工作原理之前,但在最近几天也没有长的作品。其实我对代码的做法并没有太多的想法,我想知道是否必须改变curlOptions
中的内容,或者重新编写整段代码?
谢谢。
这是您尝试访问的实际网站吗?我认为解决方案很大程度上取决于站点。 – 2012-04-18 16:25:05
@Jeff是的,那是我想要访问的页面之一 – lokheart 2012-04-18 16:49:11