missing-data

    0热度

    1回答

    我使用SPSS modeler并且我有一个变量,该软件将其识别为数字。所以missing的值是$null$。我希望变量的缺失值可以用''作为character来选择。 因此,我想:或者从numeric trasform变量的格式character或只改变missing值从$null$到''。 我该如何解决? 在此先感谢

    -1热度

    1回答

    我有这个(大)数据框,我想添加缺少的行(填充0)与名为“date”的列有关。 例如: date 0 1 2 3 4 5 199807 0 546.98 19355.55 1110.6 4720.34 3435.9 199808 0 1668.85 4398.29 5816.71 599.7 535.28 199809 608.79 446.68 2297.68 1

    2热度

    4回答

    因此,我有调查数据,我想解决调查的多个管理问题(计算机失败,浏览器关闭以及人员重新启动)。说我有案件X1和X2,由同一人的顺序进行(在这里,已经退出了作为载体) x1 <- c(1:35, rep(NA, 65)) x2 <- c(-1:-95, rep(NA, 5)) 既然我能知道发生X1首先,我要确定X1第一NA过去所有更多的条目都是NA(位置36),所以我可以合并这些案例来生成仅代表第

    0热度

    3回答

    我需要对我的数据执行z归一化(即转换变量为mean = 0和sd = 1)。 我用下面的公式(例如缩放年平均温度,“MAT”): sca$MAT <- (sca$MAT - mean(sca$MAT))/sd(sca$MAT) ,但我得到NaN值,因为很少有数据缺失这个变量。如何在上述公式中排除MAT的NA值? PS:我试图在公式中包含na.rm=TRUE,但它不起作用。 一个更快的方式很可能

    1热度

    2回答

    有条件填充丢失的数据我有一个数据帧,使得: df$v1 = c('2', '', '', '', '3', '', '4', '', '', 'OT') 我想这个可变格式化为一个序变量。然而, df$v1 = as.ordered(df$v1) 结果: Ord.factor w/ 5 levels ""<"2"<"3"<"4"<..: 2 1 1 1 3 1 4 1 1 5 [R读取空

    0热度

    2回答

    我有一个数据帧,看起来像这样: d <- data.frame(county = c("Abilene", rep(NA, 5), "Cook", rep(NA, 4), "Blah", NA, "Allegheny", rep(NA, 3))) county 1 Abilene 2 <NA> 3 <NA> 4 <NA> 5 <NA> 6 <NA> 7 Co

    0热度

    1回答

    美好的一天,亲爱的同事 你能帮助我吗?我找不到决定。我从MySQL获得数组,看起来像(数量和月): [2, 07.16, 3, 08.16, 2, 10.16, 1, 11.16, 1, 12.16, 1, 01.17] ,我需要补充一点,在这个周期内错过了0个月。对于此阵应增加08.16后0和09.16,因此成为的样子: [2, 07.16, 3, 08.16, 0, 09.16, 2, 10.

    0热度

    2回答

    我有以下data.frame,“子集” Time A B C 2016-10-07 06:16:46 NA NA 41 2016-10-07 06:26:27 40 39 42 2016-10-07 06:38:23 NA 40 NA 2016-10-07 06:41:06 42 42 44 2016-10-07 06:41:06 NA 42 44 2016-10-07 06:41

    0热度

    2回答

    我有一个包含缺失值的数据框。这些缺失的值跨越多个变量,但是在所述变量中出现,一次出现在特定观察值上。例如,我的数据帧看起来像: r1 = c('', 'abc def', '') r2 = c('1', 'ghi jkl', '2') r3 = c('', 'mno pqr', '') df = as.data.frame(rbind(r1, r2, r3)) 我想在所有情况下,“X”,

    1热度

    1回答

    我正在进行一项学校项目,在该项目中,我需要对缺失数据进行补偿,并在用鼠标进行插补后尝试使用完整功能生成完整的数据集。 当我一个接一个地运行它们时,一切正常,但我想用for循环来防止我想要的不止m = 5插值。现在,当试图运行for-loop时,我总是得到错误 完整错误(插补[1]):输入数据必须具有类'mids'。 但是当我查看这个类时是 mids,这里怎么回事? 这是我的代码: imputati