2016-07-27 56 views
0

我知道在这个主题上有很多帖子,我通常能够完成我想要的东西,但我在这个特定链接中遇到了麻烦。这很可能与excel文件的非正统布局有关。这是我的工作流程:从链接下载xlsx并导入到r

library(rest) 
url<-"http://irandataportal.syr.edu/wp-content/uploads/3.-economic-participation-and-unemployment-rates-for-populationa-aged-10-and-overa-by-ostan-province-1380-1384-2001-2005.xlsx" 
unemp <- url %>% 
    read.xls() 

产生错误Error in getinfo.shape(fn) : Error opening SHP file

问题是不相关的数据的抓取。将数据导入可用格式方面出现问题。例如,read.xls("file.path/file.csv")会产生相同的错误。

+0

查看帮助页'?download.file' – shayaa

回答

0

添加fileEncoding="latin1"解决了我的问题的选项。

url<-"http://irandataportal.syr.edu/wp-content/uploads/3.-economic-participation-and-unemployment-rates-for-populationa-aged-10-and-overa-by-ostan-province-1380-1384-2001-2005.xlsx" 
unemp <- url %>% 
    read.xls(fileEncoding="latin1") 
0

例如:

library(RCurl) 
download.file(url, destfile = "./file.xlsx") 

使用自己喜欢的阅读器,然后,

+0

我知道如何下载文件,我说的是我无法导入这个特定的文件。即使我使用任何优秀的老“读者”都可以保存它,但它不会导入。这就是为什么我提供可重复的数据! –

+1

如何在xlsx库中使用'read.xlsx'? – kitman0804

+0

我可以用''read.xlsx''导入它,但是它以我没有预料到的方式格式化。也许数据必须在Excel中手动处理。希望避免这种情况。但谢谢你的建议@ kitman0804 –