2012-12-13 52 views
1

我尝试使用下面的代码解析网页,但最后一行显示“未能加载HTTP资源”的输出。任何人都可以告诉我如何处理它?谢谢! 的代码是:无法加载R中的HTTP源

library(XML);library(RCurl) 
page=getForm("http://jobsearch.monster.com/search",query="data science") 
doc = htmlParse(page, asText = TRUE) 
joblinks = getNodeSet(doc, "//div[@class = 'jobTitleContainer']//a/@href") 
htmlParse(joblinks[[1]]) 
+0

你期待它输出什么?它似乎按预期工作 –

+0

真的吗?但在我的电脑上,它显示“错误:无法加载HTTP资源” – user1787675

+0

您尝试将网页加载到浏览器中吗? –

回答

-1

两件事情,?htmlParse将指向你的isURL标志,默认为FALSE。你想把它设置为TRUE。

其次,joblinks[[1]]中的网址似乎不起作用。这似乎并非是一个问题与您的R代码,只是信息你是拉:

# works 
htmlParse("http://stackoverflow.com/questions/13852853/failed-to-load-http-source-in-r", isURL=TRUE) 

# doesnt work 
htmlParse("http://jobview.monster.com/Cleaning-Supervisor-Job-1513-Rebel-Southwest-OH-117109119.aspx", isURL=TRUE)