cross-validation

    -1热度

    1回答

    我正在学习Python中的数据挖掘。我正在尝试交叉验证。 import numpy as np from sklearn.cross_validation import KFold X = np.array([0.1, 0.2, 0.3, 0.4]) Y = np.array([False,True,True,False]) kf=KFold(4,n_folds=2) for train

    1热度

    1回答

    我有20行60列的系列,即20个例子,每个60个参数。 kfold = StratifiedKFold(Y = encoded_Y,n_folds = 10,随机播放=真,random_state =种子) The output consists of two columns 我想知道什么是第二列是什么意思凭什么它选择两个索引。为什么不采取三个指标? Furthur,我想知道如何交叉验证功能拍摄这

    0热度

    1回答

    KNN我定义我的训练和测试集如下: colon_samp <-sample(62,40) colon_train <- colon_data[colon_samp,] colon_test <- colon_data[-colon_samp,] 而且KNN功能: knn_colon <- knn(train = colon_train[1:12533], test = colon_test

    0热度

    1回答

    我一直在阅读文档:here和here但它对我来说确实不太清楚,而且我也不明白如何使用pldically crossval来做一个离开的进行交叉验证。 vals = crossval(fun,X) vals = crossval(fun,X,Y,...) mse = crossval('mse',X,y,'Predfun',predfun) mcr = crossval('mcr',X,y,'

    0热度

    2回答

    我搜索了一下而没有找到任何东西 - 写了一个可以和Scala,Spark(MLlib)一起使用的StratifiedKFold方法。我在下面发布答案

    1热度

    1回答

    我正在使用NLTK和SKlearn测试一个舆情分析模型。 Movie_reviews数据具有“pos”和“neg”标签。对于使用“特征集”的分类器进行训练。我正在对训练数据和测试数据的准确性进行交叉验证。然而,交叉验证总是远高于准确性。在下面的逻辑回归算法CV = 97(平均),准确度= 70的例子中,我已经测试了其他算法,并且仍然交叉验证非常高。 我很确定我用于交叉验证的代码是不正确的。 imp

    6热度

    1回答

    我在理解Spark的交叉验证方面遇到了一些麻烦。我见过的任何示例都将它用于参数调整,但我认为它只会执行常规K-fold交叉验证? 我想要做的是进行k-fold交叉验证,其中k = 5。我想获得每个结果的准确性,然后获得平均准确度。 在scikit学习,这是它是如何完成的,其中分数会给你的结果每个倍,那么你可以使用scores.mean() scores = cross_val_score(clas

    13热度

    1回答

    我有一个具有〜300点和32个不同标签的数据集,我想通过使用网格搜索和LabelKFold验证绘制其学习曲线来评估LinearSVR模型。 我的代码看起来是这样的: import numpy as np from sklearn import preprocessing from sklearn.svm import LinearSVR from sklearn.pipeline impor

    1热度

    1回答

    我有两个数据集(培训和验证)用于构建和验证Cox模型。 随着训练数据集I使用逐步选择方法拟合了一个cox模型。 模型中的重要变量是包含在验证模型中的唯一变量。 这是正确的方法吗? 在验证模型时,我意识到变量在验证模型中并不重要,并且cox模型的假设也不成立(我检查了验证数据的假设)。 我是否应该忽略变量不重要的事实,并继续使用验证数据中的模型假设对问题进行修正? 第三,在培训和验证数据中,我有一个

    -1热度

    1回答

    我试图使用R的gbm回归模型。 我想计算交叉验证预测响应值与真实响应值之间的确定系数(R平方)。但gbm.object的cv.fitted值仅提供1- train.fraction的预测响应值。所以为了得到我想要的东西,我需要找到哪些观察值对应于cv.fitted值。 任何想法如何获取该信息?