2017-08-28 134 views
0

我从训练数据集中得到R中的所得回归系数。我现在想要使用它们并将它们应用于另一个数据集来预测值,但是某些X /独立变量有N/A或缺失值,这也导致预测值为N/A。我可以使用哪些命令,这样即使某些因变量信息丢失,predict()命令仍会预测该行的值?即使在R中的回归变量缺失值时也能预测

+0

'预测'正在根据您的建模函数(例如,“lm”,“glm”等)生成的回归方程生成预测。那个方程式就像'y = 0.1 * x1 + 3.26 * x2 - 0.048 * x3 + ...'。如果你的其他数据集有一个观察值(一行)缺少一个值,例如'x3',那么就没有办法为这个观测值预测'y',因为没有什么值可以插入' x3'。为了得到预测结果,您可以(1)将其他数据集中的缺失值计算出来,或者(2)仅使用其他数据集中存在的变量来训练模型。 – eipi10

+1

您可以使用'鼠标'软件包。这个软件包和函数'mice()'可以用来推测缺失的值 –

回答

2

您需要处理缺失的值。根据您处理的数据类型,您可能会相应地忽略缺失值。例如。 - 如果列的数据类型为int,则可以尝试用平均值或中值替换它们。如果你可以对你处理的数据更具体,它将提供更多的清晰度。

相关问题