cross-validation

    0热度

    1回答

    我拥有的数据集在不同文件上分开,这些文件按照相互认识的样本进行分组,即它们是在相似时间的类似条件下创建的。 火车测试数据集的平衡非常重要,因此样本必须在列车或测试中,但不能分开。所以KFold在我的scikit-learn代码上使用它并不简单。 现在 ,我使用类似的东西来LOO做类似: train ~> cat ./dataset/!(1.txt) test ~> cat ./dataset/1

    5热度

    2回答

    我有尺寸为5000 x 3027(CIFAR-10数据集)矩阵形式的训练数据集。在numpy中使用array_split,我将它分成5个不同的部分,我只想选择其中一个部分作为交叉验证折叠。然而,当我使用类似 XTrain [[Indexes]]的索引是[0,1,2,3]这样的数组时,我的问题就出现了,因为这样做会给我一个尺寸为4 x 1000 x 3027的3D张量,而不是一个矩阵。如何将“4 x

    0热度

    1回答

    问题: 我有一个数据集inputAll.data。我想使用80%的数据作为模型构建输入,并在其余20%的数据上验证模型。 我已经手动将数据集分成两个较小的数据集input80.data和input20.data分别包含80%和20%的数据。在我的数据集的数据 格式: Name xvalues yvalues Prog1 0.654219 59.70282 Prog2 0.149516

    1热度

    1回答

    我正在尝试编写一个循环以进行重复的K-fold交叉验证。基本上尝试执行10倍交叉验证并重复该过程10次以获得预测结果和10个AUC值。 我似乎在循环中遗漏了一些东西,它允许将计算出的预测移动到为k倍结果创建的空数据框的相应列中。我只在我的输出中得到最后的k-fold分数...而不是全部10.我仍然必须得到每个k-fold验证的auc值。 有没有办法将auc计算合并到循环中以获取值?如果有人能指导我

    1热度

    1回答

    我知道,一个决策树没有得到受缩放数据,但是当我扩展我的决策树中的数据它给了我一个糟糕的表现(坏召回,精度和准确度) 但是,当我不t决定了决策树给我带来的惊人结果的所有性能指标。怎么会这样? 注:我使用GridSearchCV,但我不认为交叉验证是我的问题的原因。这里是我的代码: scaled = MinMaxScaler() pca = PCA() bestK = SelectKBest(

    0热度

    1回答

    我试图使用leave-one-out(LOO)交叉验证来预测来自PCA的一些数据。 的prcomp顺利,但是当我到predict落入函数得到不高兴 error: 'newdata' must be a matrix or data frame 因为我供给载体(即,单一的行),而不是一个矩阵(即多行)。 我试过as.data.frame和as.matrix和各品种上,但我仍然得到错误 error:

    0热度

    1回答

    我正在尝试对我的文章执行Leave-one-out简历,但是当我运行该过程时,我获得了100%的准确性,我无法弄清楚我错过了什么。这是我的代码: import sklearn from sklearn.datasets import load_files import numpy as np from sklearn.cross_validation import cross_val_sco

    1热度

    2回答

    我正在尝试使用sklearn的cross_val_score函数(http://scikit-learn.org/stable/modules/cross_validation.html)进行多标签分类。 scores = cross_validation.cross_val_score(clf, X_train, y_train, cv = 10, scoring = make_sc

    0热度

    1回答

    为什么人们选择使用K倍验证而不是随机抽样k次?

    1热度

    1回答

    我使用R中的randomForest包和滚动窗口来预测财务时间序列(股票)的收益。为此我开发了一篮子功能,我的目标是了解他们的相对预测能力。 我的挑战是我不能使用随机森林的变量重要性特征,因为我的大多数特征与他们最近的过去都有很高的相关性。例如,移动平均值跨越几天的窗口,这意味着它包含我的数据集中多个观察值的信息。 这意味着由随机森林生成的袋外样本将与随机森林用于训练我的模型的样本内特征相关联。因