cross-validation

    20热度

    3回答

    有没有人可以用真正简单的语言解释我交叉验证和网格搜索有什么区别?它是如何工作的,我应该先进行交叉验证,然后进行网格搜索? 我的问题来自读这篇文档:sklearn

    0热度

    1回答

    所以我有一个数据集为162 X 151: - RT (seconds) 76_TI2 114_DECC 120_Lop 212_PCD 38 4.086 1.2 2.322 0 40 2.732 0.815 1.837 1.113 41 4.049 1.153 2.117 2.354 41 4.049 1.153 2.117 3.838 42 4.56 1.224 2.128 2.38

    1热度

    1回答

    奇点我有一个数据库,它是161 X 151,我申请我的数据集如下: - > ctrl <- trainControl(method = "repeatedcv", number = 10, repeats = 10, savePred = T) > model <- train(RT..seconds.~., data = cadets, method = "lm", trControl = c

    0热度

    1回答

    这可能是一个愚蠢的问题,但是我对我的数据执行了SVM,并且模型的最佳拟合出现在C = 0.5时,因为它提供了最佳的RMSE值。这很棒。我就可以通过执行以下操作进行10交叉折验证,十次: - ctrl <- trainControl(method = "repeatedcv", repeats = 10, savePred = T) model <- train(RT..seconds.~., d

    1热度

    2回答

    我想训练一个回归模型,为了做到这一点,我使用了随机森林模型。但是,我还需要做特征选择,因为我的数据集中有很多特征,如果我使用了所有特征,那么我会过度拟合。为了评估我的模型的性能,我还进行了5次交叉验证,我对这两种方法的问题是正确的,为什么? 1-我应该将数据分成两半,在上半年做功能选择,并使用这些选定的功能在剩下的一半上进行5次交叉验证(CV)(在这种情况下,5个CV将精确地使用相同的选定功能)。

    15热度

    3回答

    我无法找到在我尝试生成的回归随机森林模型上执行交叉验证的方法。 所以我有一个数据集包含1664个解释变量(不同的化学性质),一个响应变量(保留时间)。我试图建立一个回归随机森林模型,以便能够根据其保留时间来预测某些物质的化学性质。 ID RT (seconds) 1_MW 2_AMW 3_Sv 4_Se 4281 38 145.29 5.01 14.76 28.37 4952 40 132.1

    0热度

    1回答

    我正在尝试在Stanford NER中使用交叉验证。 feature factory列出3个属性: numFolds int 1 The number of folds to use for cross-validation. startFold int 1 The starting fold to run. numFoldsToRun int 1 The number of folds to

    0热度

    1回答

    我想知道sklearn.LassoCV如何执行交叉验证。特别是我想知道这些样本是如何在褶皱中细分的。这是一个随机的还是确定性的过程? 例如,假设我有100个样本,并且使用了10次交叉验证,并且考虑F将每个样本发送到它的函数。 F(1:10)= 1,F(11:20)= 2,...或者它是一个随机过程(例如F(1)= 8,F(2)= 7 ... ) 让我知道如果问题不明确。 谢谢:) 确定这是解决方案

    1热度

    1回答

    我进行下面就含有151个变量与161点的观测数据集: - ​​ ,并得到了以下结果: - fold 1 Observations in test set: 16 7 11 12 24 33 38 52 67 72 Predicted 49.6 44.1 26.4 39.8 53.3 40.33 47.8 56.7 58.5 cvpred 575.0 -11

    1热度

    1回答

    我可以看到cv.glm如何与glm对象一起工作,但合适的生存模型又如何呢? 我有一堆模型(Weibull,Gompertz,对数正态等)。我想用交叉验证来评估预测误差。哪个软件包/函数可以在R中做到这一点?