random-forest

    0热度

    1回答

    我使用了两种方法来计算randomForest上训练集的AUC,但我得到了非常不同的结果。这两种方法如下:计算车组的AUC的 `rf_p_train <- predict(rfmodel, type="prob",newdata = train)[,'yes'] rf_pr_train <- prediction(rf_p_train, train$y) r_auc_train[i] <- p

    0热度

    1回答

    我想计算它的准确度(在测试数据集上)。 该模式具有以下预测值: [0 1 0 1 1 1 1 0 1 0 1 0 1 1 0 0 0 1 0 1 0 1 0 0 0 1 1 0 0 0 0 0 0 0 1 1 0 1 1 1 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0] 我怎样才能把它比作实际值(在这种情况下,B或M)在检测数据得到其准确性。这对其他数据集值也应该是通

    -1热度

    2回答

    我使用随机森林算法。我想使用下面的代码。我不想通过n_folds来评估算法,我想将它分为90%的火车和10%的测试。 我改变了n_folds为n_folds=1,并添加以下行: train, test = train_test_split(dataset1, test_size=0.1, random_state = 0) ###<----- df = dataset1.astype('str'

    -5热度

    1回答

    使用以下代码时,n_fold必须是2或更多。我如何改变它可以与n_folds = 1一起工作? 将其更改为1时,对于n_folds = 2以及更多,它可以工作。有些东西似乎不起作用。 对于n_folds = 1,有下列错误: Traceback (most recent call last): File "GX.py", line 266, in <module> scores

    0热度

    1回答

    可能是一个非常愚蠢的问题,所以对我来说很容易,但在这里我去。 因此,这里就是我的数据看起来像...... date,locale,category,site,alexa_rank,sessions,user_logins 20170110,US,1,google,1,500,5000 20170110,EU,1,google,2,400,2000 20170111,US,2,facebook

    2热度

    1回答

    在随机森林的Mllib版本中,有可能使用参数categoricalFeaturesInfo 指定具有名义特征(数值但仍为分类变量)的列什么是ML随机森林?在用户指南there is an example使用VectorIndexer的类别特征转换矢量为好,但它的写有“自动识别类别特征,并对其进行索引” In the other discussion of the same problem我发现数值

    0热度

    1回答

    我想建立使用dataframes pyspark.ml库(不mllib为RDD)随机森林分类。 我是否必须使用文档中给出的管道? 我只是想建立一个简单的模型, rf = RandomForestClassifier(labelCol = labs, featuresCol = rawdata) 我碰到下面的错误 Traceback (most recent call last): F

    1热度

    4回答

    我有二进制YES/NO Class响应的数据。使用以下代码来运行RF模型。我在获取混淆矩阵结果时遇到了问题。 dataR <- read_excel("*:/*.xlsx") Train <- createDataPartition(dataR$Class, p=0.7, list=FALSE) training <- dataR[ Train, ] testing <- dataR[ -T

    1热度

    1回答

    我想在R中使用随机森林包我的数据集,其中包括分类和数值变量以及一些“不需要的coloumns”(我不想将其包括在我的预测变量中)。此外,我的一些理想变量(应该被用作预测变量)缺失。 我该如何处理?

    0热度

    1回答

    我需要制作一个采用0和1的8状态DFA,并且偶数个1和一个子字符串... 000 ...在某处。所以我知道如何找到000的子字符串,我知道如何找到偶数个1,但我不知道如何将它们放在一起。有没有像公式或什么可以遵循这一点,我只是开始DFA和NFA,所以我不太清楚如何解决这个问题,除了试验和错误。任何帮助将是巨大的