1
我试图训练一个完全卷积网络(FCN)进行密集预测。完全卷积网络中上采样层的“学习倍数”应该是多少?
的paper的作者提到:
“我们初始化2×上采样到双线性插值,但允许参数的教训。”
当我读到他们的training prototxt file时,这些层的学习倍数是零。
我是否应该将此学习倍数改为非零值以让这些图层被学习?
感谢,
我试图训练一个完全卷积网络(FCN)进行密集预测。完全卷积网络中上采样层的“学习倍数”应该是多少?
的paper的作者提到:
“我们初始化2×上采样到双线性插值,但允许参数的教训。”
当我读到他们的training prototxt file时,这些层的学习倍数是零。
我是否应该将此学习倍数改为非零值以让这些图层被学习?
感谢,
引述shelhamer
在上PASCAL VOC进一步实验中,我们发现,学习插补参数没有什么差别,而固定这些权重给出了自略有加速插值滤波器的梯度可以被跳过。
因此,您可以通过这种方式保留lr_mult
,或者如果您希望他们学习,可以更改为非零值。如果需要,还可以在solver.prototxt中设置lr_policy
。
谢谢lnman,正如你看到的,有很多深学习型社会的矛盾。 ;) – Ali