2017-07-22 21 views
0

我有一个数据集,一个类有45个观察值,另一个类有55个观察值。此外,我使用4个不同的功能,这些功能以前是通过使用功能选择过滤器选择的,虽然此过程的结果有点奇怪。 %到85%),因为我在Matlab上使用classificationLearner。这将确保没有过度配合?或者仍然有机会呢?我如何确保没有过度配合?交叉验证是否足以确保分类算法中不存在过度拟合?

回答

0

这确实取决于您有可用的训练数据集。如果您可获得的数据不够具有代表性,则无论您使用什么方法进行培训和验证,都无法获得一个好的模型。考虑到这一点,如果你确定你的数据是有代表性的(对于任何“重要”属性的任何子集都具有与所有数据的全局集合相同的数值分布),那么交叉验证就足够依赖于。

+0

非常感谢您的亲切帮助! –