我一直在使用单GPU(GeForce GTX 980 Ti,6GB)的适度机器上训练Inception V3。最大批量大小看起来大约为40
。在适度的硬件设置上训练Tensorflow Inception-v3 Imagenet
我已使用inception_train.py
文件中指定的默认学习率设置:initial_learning_rate = 0.1
,num_epochs_per_decay = 30
和learning_rate_decay_factor = 0.16
。一对夫妇的训练精度最好我能做到的,是如下(约500K-1M迭代)周后:
2016-06-06 12:07:52.245005: precision @ 1 = 0.5767 recall @ 5 = 0.8143 [50016 examples]
2016-06-09 22:35:10.118852: precision @ 1 = 0.5957 recall @ 5 = 0.8294 [50016 examples]
2016-06-14 15:30:59.532629: precision @ 1 = 0.6112 recall @ 5 = 0.8396 [50016 examples]
2016-06-20 13:57:14.025797: precision @ 1 = 0.6136 recall @ 5 = 0.8423 [50016 examples]
我试着朝训练课结束的设置摆弄,但在准确性方面看不到任何改进。
我已经从头开始了一个新的培训课程,其中num_epochs_per_decay
= 10和learning_rate_decay_factor
= 0.001基于本论坛中的一些其他帖子,但它在这里是黑暗中的一种掌握。
上好的默认值小的硬件设置,像我的任何建议?