我想使用Weka训练一个MultiLayerPerceptron,具有〜200个样本和6个属性。 我正在考虑拆分列车和测试,并在列车上指定列车的某个百分比作为验证集。 但是后来我考虑使用fold-crossvalidation来更好地使用我的样本集。使用验证集与交叉验证方法是否有意义?
我的问题是:是否做了交叉验证方法时是有意义的指定验证组?
而且,考虑到样本的大小,你可以建议我一些号码,这两种方法? (例如2/3列车,1/3测试,和20%的验证...以及用于CV:10倍,2倍,或代替LOOCV ...)
预先感谢您!
谢谢@fanfabbb!是的,可能我感到困惑,因为weka Explorer中的“validationSet”选项仍然可用,即使您选择了交叉验证。这就是为什么我不确定这是否合理。是的,您提到的这些“更复杂的方法”是我所指的 - 但可能我没有足够清楚地解释它 - 谢谢分裂的建议。我必须考虑在训练期间是否可以“减少”减少1/3的样本。也许这应该让我决定简历... – PGreen