0
我注意到predict()只会在完整的情况下创建预测。我已经包含在预处理选项medianImpute
,如下列:预处理插补R插入符号和预测
train(outcome ~ .,
data = df,
method = "rf",
tuneLength = 5,
preProcess = c("YeoJohnson", "center", "scale", "medianImpute"),
metric = 'ROC',
trControl = train_ctrl)
}
这是否意味着,我要训练集之前做的缺失值估算?如果不是,我无法为测试集中的所有情况创建一个预测。我曾在Kuhn博士的书中读过预处理应在交叉验证过程中发生......谢谢!
谢谢Lyzander。当我使用medianImpute时,这很有意义。 – user2300643 2014-11-22 17:54:33
这是否也适用于转换? – user2300643 2014-11-23 19:35:17
这取决于转型。如果转换是基于平均值和方差的话,那么是的。 – LyzandeR 2014-11-23 20:19:36