2016-12-15 202 views
-1

我正在寻找一个类似于FindReplace的函数,这将允许我根据矢量而不是单个值映射值。R用矢量映射的值映射

我有一个看起来像这样的查找表,我想用它来映射数据框中的值。

Headers: COLUMN_NAME, CODE, DESCRIPTION 
Row1: arrmin, 97, Officially Cancelled 
Row2: arrmin, 98, Unknown if Arrived 
Row3: atmcond, -1, Blank 
Row4: atmcond, 0, No Additional Atmospheric Conditions 

此查找表有成千上万行的,所以我不能手动输入他们,和我原来的解决方案是效率太低,将需要数天才能运行。

我使用具有几百列如arrminatmcond需要从97改变的值,以正式取消该

的值从0-100(或然而许多值有)数据帧,等等。根据它所在的列进行更改。我已经在下面编写了这些代码,但它效率非常低,需要几天才能运行30万行。

columnsToReplace <- which(colnames(CRASH) %in% CapitalColumns) 
dfColumns <- colnames(CRASH) 
for (i in columnsToReplace){ 
    tempColumn <- dfColumns[i] 
    tempLookup <- capitalLookupTable[which(capitalLookupTable$COLUMN_NAME ==tempColumn),] 
    CRASH <- FindReplace(data=CRASH,Var=tempColumn,replaceData = capitalLookupTable, 
      from = "Code",to = "Description",exact=T) 
} 

columnsToReplace是我创建了一个包含每个中存在的查找表中的列的字符串名称的向量。

回答

0
#Some data 
s<-data.frame(A=c(1,1,2,2),B=c(2,4,6,6),C=c(1,3,5,7)) 
mapping<-data.frame(ColumnName=c(rep("A",2), rep("B",3), rep("C",4)), Code=c(1,2,2,4,6,1,3,5,7)) 
mapping$Description<-paste0(mapping$ColumnName, mapping$Code) 

#From wide to long 
library(reshape) 
melted.s<-melt(s) 

#Join 
melted.s<-merge(melted.s, mapping, by.x=c("variable","value"), by.y=c("ColumnName","Code")) 

#From long to wide 
p<-data.frame(matrix(melted.s$Description, ncol=ncol(s))) 
names(p)<-names(s)