2016-02-12 60 views
0

我使用gbm(..., data = traindata, ...)训练模型,并使用predict(... newdata = newdata, ...)进行预测。gbm中预测的输入数据

我的问题:traindata和newdata需要有相同的格式(变量的顺序和数量)?

在GBM说明书中,下列是为预测()写成:

如果对象是使用gbm.fit适合将没有条款组件。 因此,用户有更大的责任确保 新数据具有与最初用于拟合模型的 相同的格式(变量的顺序和数量)。

这对gbm还是只适用于gbm.fit? newdata可以有不同于traindata的格式吗?

由于

回答

0

比方说你的数据具有的M个N(样品和变量N个M个)的尺寸,如果是这样,那么您的预测集需要的K N表示接着样品的数量是不重要,但变量的数量是。希望它有帮助

0

谢谢,但是预测集中的N个变量需要与训练集(gbm)具有相同的顺序吗?

此外,与训练集相比,预测集可以有额外的变量吗?在预测中显然应该忽略这些参数。

我的问题是gbm()和predict()是否识别变量的标签。如果是这样,则预测集中的变量和附加变量的顺序应该对预测没有影响。

谢谢

相关问题