2013-12-10 60 views
1

我想使用插补来替换数据集中的缺失值。我有一些限制,例如我不希望虚拟变量x1小于我的两个其他变量的总和,比如说x2 and x3。我也希望被0 or 14 or >= 14 and推算出来,x2被0 or 16 or >= 16推算出来。我尝试在spss中定义这些约束,例如多重插补,但是在spss中我只能定义最大值和最小值。有没有什么方法可以在spss中定义furthur约束,或者您是否知道任何R包让我可以定义这些约束来填补缺失值?R中缺失值的多个插补

x1 =c(21, 50, 31, 15, 36, 82, 14, 14, 19, 18, 16, 36, 583, NA,NA,NA, 50, 52, 26, 24) 
    x2 = c(0, NA, 18,0, 19, 0, NA, 0, 0, 0, 0, 0, 0,NA,NA, NA, 22, NA, 0, 0) 
    x3 = c(0, 0, 0, 0, 0, 54, 0 ,0, 0, 0, 0, 0, 0, NA, NA, NA, NA, 0, 0, 0) 
    dat=data.frame(x1=x1, x2=x2, x3=x3) 
    > dat 
     x1 x2 x3 
    1 21 0 0 
    2 50 NA 0 
    3 31 18 0 
    4 15 0 0 
    5 36 19 0 
    6 82 0 54 
    7 14 NA 0 
    8 14 0 0 
    9 19 0 0 
    10 18 0 0 
    11 16 0 0 
    12 36 0 0 
    13 583 0 0 
    14 NA NA NA 
    15 NA NA NA 
    16 NA NA NA 
    17 50 22 NA 
    18 52 NA 0 
    19 26 0 0 
    20 24 0 0 
+0

这绝对是可能的,但展示答案需要一些数据,所以请提供一些示例数据。 – Thomas

+0

你只有整数值吗? – agstudy

+0

@ Thomas。我提供了示例数据。 – rose

回答

0

如果您只整数值,你可以这样做:

N <- 5 
set.seed(1) 
dat <- data.frame(x1 = sample(1:10,N,rep=TRUE), 
        x2 = sample(1:10,N,rep=TRUE), 
        x3 = sample(c(1,NA),N,rep=TRUE)) 

> dat 
    x1 x2 x3 
1 3 9 1 
2 4 10 1 
3 6 7 NA 
4 10 7 1 
5 3 1 NA 
## x3 < sum(x1,x2) 
transform(dat,x3 =ifelse(is.na(x3),sample(seq(x1+x2-1),1),x3)) 
    x1 x2 x3 
1 3 9 1 
2 4 10 1 
3 6 7 3 
4 10 7 1 
5 3 1 3 
## x3 in c(0,14) 
transform(dat,x3 =ifelse(is.na(x3),sample(c(0,14),1),x3)) 
    x1 x2 x3 
1 3 9 1 
2 4 10 1 
3 6 7 14 
4 10 7 1 
5 3 1 14 
0

那么,你当然可以这样做,在SPSS用简单的转换逻辑,但我本来以为一会希望根据已知值的分布进行估算。