我试图读入R一个包含政治捐款信息的csv文件。据我所知,默认情况下的列是作为因子导入的,但我需要将数据列(数据集中的'CTRIB_AMT')作为数字列导入,以便我可以运行各种不起作用的函数因素。该列被格式化为以“$”作为前缀的货币。在货币列中读取R中的csv文件作为数字
我用一个简单的读命令导入最初的文件:
contribs <- read.csv('path/to/file')
,然后试图向CTRIB_AMT从货币转换为数字:
as.numeric(as.character(sub("$","",contribs$CTRIB_AMT, fixed=TRUE)))
但没有奏效。我试图使用的CTRIB_AMT列的功能有:
vals<-sort(unique(dfr$CTRIB_AMT))
sums<-tapply(dfr$CTRIB_AMT, dfr$CTRIB_AMT, sum)
counts<-tapply(dfr$CTRIB_AMT, dfr$CTRIB_AMT, length)
参阅相关的问题here。
有关如何最初导入文件的任何想法列是数字或如何将其转换后导入?
文件内容的一个小例子会很有帮助。 –
'sub' - >'as.character' - >'as.numeric'转换应该有效。 “没有工作”是什么意思? –
适合我。 'CTRIB_AMT < - factor(c(“$ 5000”,“$ 2500”,“$ 100”)); (as.numeric)(as.character(sub(“$”,“”,CTRIB_AMT,fixed = TRUE)))' –