random-forest

0热度

1回答

我使用了两种方法来计算randomForest上训练集的AUC，但我得到了非常不同的结果。这两种方法如下：计算车组的AUC的 `rf_p_train <- predict(rfmodel, type="prob",newdata = train)[,'yes'] rf_pr_train <- prediction(rf_p_train, train$y) r_auc_train[i] <- p

0热度

1回答

比较python中RF模型的准确性

我想计算它的准确度（在测试数据集上）。该模式具有以下预测值： [0 1 0 1 1 1 1 0 1 0 1 0 1 1 0 0 0 1 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0] 我怎样才能把它比作实际值（在这种情况下，B或M）在检测数据得到其准确性。这对其他数据集值也应该是通

-1热度

2回答

拆分数据集90,10，而不是n_folds

我使用随机森林算法。我想使用下面的代码。我不想通过n_folds来评估算法，我想将它分为90％的火车和10％的测试。我改变了n_folds为n_folds=1，并添加以下行： train, test = train_test_split(dataset1, test_size=0.1, random_state = 0) ###<----- df = dataset1.astype('str'

-5热度

1回答

为什么下面的代码不能得到n_fold = 1的值？

使用以下代码时，n_fold必须是2或更多。我如何改变它可以与n_folds = 1一起工作？将其更改为1时，对于n_folds = 2以及更多，它可以工作。有些东西似乎不起作用。对于n_folds = 1，有下列错误： Traceback (most recent call last): File "GX.py", line 266, in <module> scores

0热度

1回答

预测使用sklearn的RandomForestRegressor

可能是一个非常愚蠢的问题，所以对我来说很容易，但在这里我去。因此，这里就是我的数据看起来像...... date,locale,category,site,alexa_rank,sessions,user_logins 20170110,US,1,google,1,500,5000 20170110,EU,1,google,2,400,2000 20170111,US,2,facebook

2热度

1回答

如何处理Spark中最新的随机森林中的分类特征？

在随机森林的Mllib版本中，有可能使用参数categoricalFeaturesInfo 指定具有名义特征（数值但仍为分类变量）的列什么是ML随机森林？在用户指南there is an example使用VectorIndexer的类别特征转换矢量为好，但它的写有“自动识别类别特征，并对其进行索引” In the other discussion of the same problem我发现数值

0热度

1回答

随机森林使用pyspark.ml为Dataframes

我想建立使用dataframes pyspark.ml库（不mllib为RDD）随机森林分类。我是否必须使用文档中给出的管道？我只是想建立一个简单的模型， rf = RandomForestClassifier(labelCol = labs, featuresCol = rawdata) 我碰到下面的错误 Traceback (most recent call last): F

1热度

4回答

R中的随机森林混乱矩阵Caret

我有二进制YES/NO Class响应的数据。使用以下代码来运行RF模型。我在获取混淆矩阵结果时遇到了问题。 dataR <- read_excel("*:/*.xlsx") Train <- createDataPartition(dataR$Class, p=0.7, list=FALSE) training <- dataR[ Train, ] testing <- dataR[ -T

1热度

1回答

随机森林混合分类，数字和“不需要”的变量，其中包括缺失值

我想在R中使用随机森林包我的数据集，其中包括分类和数值变量以及一些“不需要的coloumns”（我不想将其包括在我的预测变量中）。此外，我的一些理想变量（应该被用作预测变量）缺失。我该如何处理？

0热度

1回答

确定性有限自动机状态图

我需要制作一个采用0和1的8状态DFA，并且偶数个1和一个子字符串... 000 ...在某处。所以我知道如何找到000的子字符串，我知道如何找到偶数个1，但我不知道如何将它们放在一起。有没有像公式或什么可以遵循这一点，我只是开始DFA和NFA，所以我不太清楚如何解决这个问题，除了试验和错误。任何帮助将是巨大的