2017-03-01 130 views
1

我的EEG数据集包含一些科目的数据,每个科目有4个部分。
主要论文采用了以下方法:
它使用了两个部分的主题。第一部分用作训练数据,第二部分用作测试集。
我想使用k-fold交叉验证,但我需要注意纸张方法的条件(第1部分为训练集,第2部分为测试集)。
首先,我需要将我的数据分成k个部分,然后使用k-1部分作为训练,其他1个作为测试,并在k循环中执行此过程。 我的数据分为两部分,我如何在一部分中看到两部分?有可能混合数据吗? 如果我混合他们应该如何使用纸张的条件? 在此先感谢。基于试验的数据集的k倍交叉验证

回答

1

首先你的问题非常模糊!你没有解释条件是什么或应该是什么。
无论如何,在K-fold中,您的数据被统一分割成k个相同大小的子样本。在这些k个子样本中,每次将一个子样本分开并用作您的验证集,其余部分将用作您的训练集。这个过程重复k次(折叠),直到所有分区仅用作验证一次。然后可以对褶皱的k个结果进行平均以产生单个估计。

我不正是得到你的主题意思,但如果纸张使用部分1和两个分别用于训练和测试(验证),你可以做以下任一操作:

  1. 您可能结合这两部分,然后在这个新合并的数据集上应用K-fold。
  2. 预留测试数据(第二部分),在第一部分上运行的k倍,因此你将你用于查找/微调的参数具有K-1倍你的训练,1为验证 /网络/型号, 和您最终用于测试的一个测试装置