4
我正在使用randomForest
函数从randomForest包中找到最重要的变量: 我的数据框称为urban,我的响应变量是数字收入。R随机森林:data(x)有0行
urban.random.forest <- randomForest(revenue ~ .,y=urban$revenue, data = urban, ntree=500, keep.forest=FALSE,importance=TRUE,na.action = na.omit)
我得到以下错误:
Error in randomForest.default(m, y, ...) : data (x) has 0 rows
的源代码它关系到x
变量:
n <- nrow(x)
p <- ncol(x)
if (n == 0)
stop("data (x) has 0 rows")
但我不明白什么是x
。
您正在混合公式和默认方法。如果你传递一个公式给'randomForest',你不应该再传递'y'值,因为那么函数就会假定公式是'x'值,并且出错了。 – Roland
我删除了y = urban $收入,但错误依然存在:randomForest.default(m,y,...)中的错误:data(x)有0行 –
我还有一个新错误:另外:警告消息: 在randomForest.default(m,y,...)中: 响应具有五个或更少的唯一值。你确定要做回归吗?虽然我的响应变量具有58个唯一值长度(唯一(城市$收入))#== 58 –