2016-09-05 125 views
0

我正在对语言数据进行回归,我想要预测句子的数值情感值。我的数据是120x531。我正在使用所谓的词袋方式,因此我的数据相对较少。R的Caret包混淆了线性模型(lm)和随机森林

我想从一个简单的线性回归模型,所以我的代码基本上是这样的:

ctrl = trainControl(method="cv", number=10) 
model.valence.lm = train(data[,5:531], data[,2], model = "lm", trControl = ctrl) 
model.valence.lm 

然而,插入符号似乎混淆线性模型和随机森林,所以我得到下面的输出(具体见第一行):

Random Forest 

120 samples 
527 predictors 

No pre-processing 
Resampling: Cross-Validated (10 fold) 
Summary of sample sizes: 108, 108, 108, 108, 108, 108, ... 
Resampling results across tuning parameters: 

    mtry RMSE  Rsquared RMSE SD Rsquared SD 
    2 2.594079 0.2786009 0.1236510 0.1612251 
    32 2.459950 0.1920956 0.1886138 0.1484976 
    526 2.639718 0.1028518 0.2459268 0.1067835 

RMSE was used to select the optimal model using the smallest value. 
The final value used for the model was mtry = 32. 

是什么使这更混乱对我来说是一个事实,那我基本上复制并从以前的项目中粘贴此代码(如果这个工作)。有没有人有任何想法,为什么发生这种情况?我检查了我的数据对象,显然我使用的功能是整数(不是数字/浮点数)。可能这是一个可能的解释?

回答

1

Random Forest或“rf”是method参数的默认参数。你已经设置了model参数,该参数在任何情况下都可以接受,但不予理睬。使用method="lm"