cross-validation

    -1热度

    1回答

    我有一组数据用于训练神经网络,但我相信我的问题属于任何类型的机器学习。 我的数据分为两类,但是我有更多类的例子比我做的第二类更多。在我继续并在我的数据上训练神经网络之前,我打算将数据分成3个独立的组(培训,验证和测试),并在每一个组中重复我为第一课所用的数据足够多次,以便让我拥有等同于该组中每个班级的数据。 这真的很乏味,我敢打赌,其他人也有同样的问题。有没有一个python库为我做这个?或者至少

    1热度

    1回答

    我正在构建一个算法,该算法使用BFGS方法来查找Octave中二进制数据集的逻辑回归中的参数。 现在,我正在努力解决一些我认为是过度配合的问题。我运行几个数据集的算法,它实际上收敛到与Octave的fminunc函数相同的结果。然而,对于特定的“类型的数据集”,该算法收敛于非常高的参数值,与fminunc相反,这给出了这些参数的可分级值。我添加了一个正则化术语,实际上我实现了我的算法来收敛到fmi

    0热度

    1回答

    我的目标是基于等级评估添加到CrossValidator功能(PySpark) cvExplicit = CrossValidator(estimator=cvSet, numFolds=8, estimatorParamMaps=paramMap,evaluator=rnkEvaluate) 虽然我需要评估的数据帧传递到功能,我不知道如何做那部分。 class rnkEvaluate():

    0热度

    1回答

    如何在深层神经网络中进行交叉验证?我知道要执行交叉验证来训练除了一个以外的所有折叠,并在排除的折叠上测试它。然后做这个k倍的时间,并平均每个倍数的accuries。你如何为每次迭代做到这一点。你是否每次更新参数?或者你为每次迭代执行k-fold交叉验证?或者是每个训练都是在所有褶皱上进行,但是有一次迭代被认为是一次迭代?

    -1热度

    1回答

    我知道这是一个非常经典的问题,可以在这个论坛中多次回答,但是我找不到任何明确的答案,从头开始清楚地解释这个问题。 首先,我的数据集名为my_data有4个变量,如 my_data =变量1,变量2,variable3 imgine,target_variable 那么,让我们来我的问题。我会解释我的所有步骤,并要求你对我一直停留在那里帮助: # STEP1 : split my_data into

    -1热度

    1回答

    在以下链接提供的代码中,我需要在训练循环中添加10倍交叉验证,但我对Tensorflow很陌生,而且我真的很难找到一种方法来做到这一点,但仍然不知道。 https://github.com/nfmcclure/tensorflow_cookbook/blob/master/04_Support_Vector_Machines/06_Implementing_Multiclass_SVMs/06_m

    0热度

    1回答

    我有两个数据集。 train <- read.csv("train.csv") test <- read.csv("test.csv") 列车组中的数据如下所示。 > str(train) 'data.frame': 891 obs. of 12 variables: $ PassengerId: int 1 2 3 4 5 6 7 8 9 10 ... $ Survived : Fa

    2热度

    1回答

    我正试图构建HMM模型以离散序列为基础。 意思是我有单元阵列,每个单元包含一个不同长度的序列。 例如: seqs{1} = 2 3 6 4 7 1 5 13 14 15 16 0 0 0 0 12 seqs{2} = 2 3 6 4 7 1 5 19 10 11 13 seqs{3} = 2 3 6 4 7 1 5 19 10 seqs{4} =

    1热度

    1回答

    我一直在玩sklearn中的StratifiedKFold随机状态变量,但它似乎并不随机。我相信设置random_state=5,应该给我一个不同的测试集,然后设置random_state=4,但这似乎并非如此。我在下面创建了一些原始可重现的代码。首先我打开我的数据: import numpy as np from sklearn.cross_validation import Stratifi

    2热度

    2回答

    我使用sklearn包构建逻辑回归模型,然后对其进行评估。具体来说,我想要使用交叉验证来做到这一点,但无法找到使用cross_val_score函数的正确方法。 按照documentation和一些examples我看见了,我需要通过功能的型号,功能,结果和评分方法。然而,AUC不需要预测,它需要概率,因此它可以尝试不同的阈值并基于此计算ROC曲线。那么这里的正确方法是什么?这个函数有'roc_a