gbm中预测的输入数据

我使用gbm(..., data = traindata, ...)训练模型，并使用predict(... newdata = newdata, ...)进行预测。gbm中预测的输入数据

我的问题：traindata和newdata需要有相同的格式（变量的顺序和数量）？

在GBM说明书中，下列是为预测（）写成：

如果对象是使用gbm.fit适合将没有条款组件。因此，用户有更大的责任确保新数据具有与最初用于拟合模型的相同的格式（变量的顺序和数量）。

这对gbm还是只适用于gbm.fit？ newdata可以有不同于traindata的格式吗？

由于

比方说你的数据具有的M个N（样品和变量N个M个）的尺寸，如果是这样，那么您的预测集需要的K N表示接着样品的数量是不重要，但变量的数量是。希望它有帮助

2016-02-12 17:08:33 nik

谢谢，但是预测集中的N个变量需要与训练集（gbm）具有相同的顺序吗？

此外，与训练集相比，预测集可以有额外的变量吗？在预测中显然应该忽略这些参数。

我的问题是gbm（）和predict（）是否识别变量的标签。如果是这样，则预测集中的变量和附加变量的顺序应该对预测没有影响。

谢谢

2016-02-13 19:38:40 TomDriftwood

回答