我正在使用R执行我的分析,我将执行四种算法。 1. RF
2. Log Reg
3. SVM
4. LDA
我有50个预测变量和1个目标变量。我所有的预测变量和目标变量都只有二进制数字0和1。 我有以下问题: Should I convert them all into factors?
Converting them into factors, and applying RF alg
对于下面的代码,我的r平方分数出来为负,但我的精度分数使用K-双倍交叉验证即将达到92%。这可能怎么样?我使用随机森林回归算法来预测一些数据。该数据集的链接在下面的链接中给出: https://www.kaggle.com/ludobenistant/hr-analytics import numpy as np
import pandas as pd
from sklearn.preproc
是否有一种使用GridSearch自动调整随机森林分类器的方法。我们没有提供这些值,而是有任何方法可以找到最佳的最佳参数值。 rfc = RandomForestClassifier(n_jobs=-1, max_features='sqrt', oob_score = True)
# Use a grid over parameters of interest
param_