0
如何在R中使用randomForest库运行随机森林,如果某些预测变量的列中有NaN值。具有NaN值的随机森林
rf <- randomForest(class ~ maxf + minf + d + startf + endf + f1.4 + f1.2 + f3.4 + minslope + maxslope+ bslope + eslope + avgsl + noex + noip, data=whistles_nov, importance=TRUE)
给出了这样的错误:
Error in na.fail.default(list(class = c(6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, :
missing values in object
是否在MATLAB工作TreeBagger功能,不论NaN值吗?
使用rfImpute来首先计算mssing值 –
我会使用适当的插补方法(或者如果可接受的话移除带有NaN值的行)来运行它。如果它是一个类变量,你可能只需添加一个新的“缺少”类别。如果您在多个数字列中有很多缺失值,由于随机森林的工作原理,它可能会变得复杂。 –