cross-validation

1热度

1回答

我试图用简单的装修和交叉验证以下列方式： library(ISLR) attach(Auto) Auto$cut.values = cut(displacement,2) fit = glm(mpg~Auto$cut.values) cv.glm(Auto, fit, K=10)$delta[1] 但是我收到一个错误： Error in model.frame.default(for

1热度

1回答

如何对多类数据进行交叉验证？

我可以用下面的方法做的二进制数据的交叉验证，但似乎不工作的多类数据： > cross_validation.cross_val_score(alg, X, y, cv=cv_folds, scoring='roc_auc') /home/ubuntu/anaconda3/lib/python3.6/site-packages/sklearn/metrics/scorer.py in __cal

0热度

2回答

通过不同的数据帧回路回归

目标是在不同的训练数据框上执行多个logit回归，然后评估各个测试数据集的性能。首先，我们从df创建多个（5）随机取样的数据帧： for(i in 1:5) { nr <- paste("random_df", i, sep = "_") assign(nr, random_df[sample(nrow(df)),]) } 然后，我们创建用于分离指标分成训练 - 和测试集： train

0热度

2回答

从K倍中挑选哪个模型交叉验证

我在阅读关于交叉验证以及如何使用它来选择最佳模型和估计参数，但我并没有真正理解它的含义。假设我建立一个线性回归模型并进行10倍交叉验证，我认为这10个系统中的每一个都有不同的系数值，现在来自10个不同的系统值，我应该选择它作为我的最终模型或估计参数。或者我们是否仅使用交叉验证来寻找平均误差（本例中为10个模型的平均值）并与另一个模型进行比较？

0热度

1回答

的交叉验证Matlab的ROC曲线SVM

我需要绘制的SVM分类ROC曲线，下面的话题和MATLAB例子很多线程，我不喜欢下面 mdlSVM = fitcsvm(pred,resp,'Standardize',true); mdlSVM = fitPosterior(mdlSVM); [~,score_svm] = resubPredict(mdlSVM); [Xsvm,Ysvm,Tsvm,AUCsvm] = perfcurve(r

3热度

2回答

使用测试集合评估协同过滤算法

使用基于项目的协作过滤，我们利用类似用户对给定用户的项目评分来生成推荐。研究经常建议使用保留测试集来评估算法，例如20％的数据与80％的培训。但是，如果在特定项目的所有评级都被拒绝的情况下呢？我们的培训数据将不再包含该项目，并且永远不会推荐。 E.g. 5个用户每人观看10部电影，其中之一是'泰坦尼克号'。我们随机推出了每个用户20％数据的测试集= 2部电影/用户。如果“泰坦尼克号”在每个用户的测

0热度

1回答

误差scikit学习CV

当我尝试在Python以下 from sklearn.model_selection import KFold 但后来当我尝试定义KFold kf=KFold(33,10, shuffle=True) 我收到以下错误： --------------------------------------------------------------------------- TypeError

0热度

1回答

如何证明使用具有更高RMSE的预测模型（cv = 10）

我正在研究预测模型。为了得到最好的模型，我使用cross_val_score针对不同型号CV = 10和RMSE之间的比较，我得到如下： Lasso SVR NuSVR GradientBoostingRegressor RandomForestRegressor Modeling Methods(15 fact and FR) 0.748253 0.779394 0.77

0热度

1回答

如果不平衡的处理方法都不起作用

当前有哪些问题我遇到的是分类结果是不好即使我使用了许多不平衡的加工技术，如resampling，smote，cost-learning。具体来说，我有一个数据集，困难和容易是2班在我的数据集。虽然课堂分发服务不平衡（困难：简单= 187：13）在我的数据集。我使用random forest来训练我的模型并使用10-fold cross validation对其进行评估，结果是在线“无策略”。

1热度

1回答

使用预定义的验证集执行网格搜索Sklearn

此问题之前已被多次询问。但是当我回答下面的问题时，我得到一个错误：首先我指定哪一部分是训练集和验证集，如下所示。 my_test_fold = [] for i in range(len(train_x)): my_test_fold.append(-1) for i in range(len(test_x)): my_test_fold.append(0) 然