2017-02-23 68 views
1

我想将值NA设置为在特定日期之前发生的数据帧内的某些行/列。但是每一列都有不同的日期/标准。那么这将如何工作?根据日期标准将某些值设置为数据帧

样品数据框:

dates <- c("01/01/2015", "06/15/2015", "11/30/2015") 
a <- c(1, 2, 3) 
b <- c(2, 4, 6) 
c <- c(3, 5, 9) 
df <- data.frame(Date = dates, A = a, B = b, C = c) 

startDate <- c("02/20/2015", "07/28/2015", "12/01/2015") 

所以我data.frame应该是这样的:

Date  A  B  C 
    01/01/2015 1  2  3 
    06/15/2015 2  4  5 
    11/30/2015 3  6  9 

使用startDate为我的标准,我想在相对该日期之前设置的任何值列到NA,以便我的最终结果如下所示:

Date  A  B  C 
    01/01/2015 NA  NA NA 
    06/15/2015 2  NA NA 
    11/30/2015 3  6  NA 

有人可以帮我吗? 顺便说一句,我真正的data.frame有大约20 +列。以上只是我实际问题的一个小例子。

在此先感谢!

回答

0

测试此:

#Do a pairwise comparison of dates using outer 
m = matrix(
    as.numeric(
     outer(as.Date(as.character(df[,1]), format = "%m/%d/%Y"), 
       as.Date(as.character(startDate), format = "%m/%d/%Y"), ">") 
    ), 
    nrow = nrow(df)) 

m[m == 0] = NA #Set zeroes in m to NA 
df[,2:ncol(df)] = df[,2:ncol(df)] * m #Multiply the columns of df (except 1st) with m 
df 
#  Date A B C 
#1 01/01/2015 NA NA NA 
#2 06/15/2015 2 NA NA 
#3 11/30/2015 3 6 NA 
+0

感谢这个 - 虽然,它不一定会工作,以取代NA零在下一步如果有为零的起始日期后的值,对不对? – RiddleMeThis

+0

@RiddleMeThis,输出应该是你现在想要的。下一步无需转换为“NA”。 –

+1

我认为它最好不乘以m,而是用m除以代替。这会给你NaN和Inf值,然后你可以使用do.call(df,lapply(df,function(x)replace(x,is.infinite(x),NA)))来将值转换为NAs 。非常感谢!这真的帮助我。 – RiddleMeThis