4

我目前通过研究像MNIST示例这样的示例来了解卷积神经网络。在神经网络的训练,我经常看到这样的输出:什么是神经网络中的列车损失,有效损失和列车/ Val平均值

Epoch | Train loss | Valid loss | Train/Val 
--------|--------------|--------------|--------------- 
    50 | 0.004756 | 0.007043 |  0.675330 
    100 | 0.004440 | 0.005321 |  0.834432 
    250 | 0.003974 | 0.003928 |  1.011598 
    500 | 0.002574 | 0.002347 |  1.096366 
    1000 | 0.001861 | 0.001613 |  1.153796 
    1500 | 0.001558 | 0.001372 |  1.135849 
    2000 | 0.001409 | 0.0|  1.144821 
    2500 | 0.001295 | 0.001146 |  1.130188 
    3000 | 0.001195 | 0.001087 |  1.099271 

除了时代,有人可以给我究竟每一列代表和什么值的含义的解释?我看到很多关于cnn的基本教程,但我没有遇到过详细解释这个的教程。

回答

6

除了用于训练网络的数据之外,似乎还使用了一组保留的数据。训练损失是训练集数据上的错误。验证丢失是在通过训练网络运行验证数据集后发生的错误。培训/有效是两者之间的比例。

意外的是,随着时代的增加验证和训练误差的下降。但是,在某一点上,尽管训练错误持续下降(网络更好更好地学习数据),但验证错误开始上升 - 这是overfitting

相关问题