2017-06-05 187 views
-3

我有一个非常小的数据集(40个训练样例,10个验证示例,120个类),我在Keras(蝙蝠技术,变平和致密层)中使用非常简单的模型获得非常高的精度。验证准确性总是可以和训练准确度一样高吗?

我的培训准确率为94-95%,验证准确率为76-78%。我知道这是过度配合,我已经尝试了一些东西。数据不是图像,所以我不能增加数据。我也不能添加数据,因为它是一个特定的类型。我使用了0.5级别的两个dropout层,并且架构非常简单,所以我不认为我可以减少架构的复杂性。如果有人喜欢,我可以粘贴模型。

我的问题是:有没有验证准确度不能像培训准确度那么高的情况?是否有基于数据集大小的限制?还是总是有可能使验证准确性与训练精度相匹配,而网络只需要正确的参数?

非常感谢你

+2

投票结束,您最好在stats.stackexchange或数据科学网站上提问。要回答你的问题,是的,这是可能的,但极不可能。例如,在您的测试集是您的分类集的完全副本的情况下。更一般地说,如果您确实发现了真正的数据生成过程,那么您应该获得“相同”的培训和验证准确性。 – Alex

+0

谢谢Alex。我会在那里发布。 – Randy

回答

-1

这肯定是过度配合。

过拟合不仅仅是因为“太强大的模型”,而且还有很多,因为没有足够的数据,我相信这是你的情况。

40个120级示例?这听起来很像很多数据丢失。

+0

谢谢你的回复。 – Randy

相关问题