完全卷积网络中上采样层的“学习倍数”应该是多少？

的paper的作者提到：

“我们初始化2×上采样到双线性插值，但允许参数的教训。”

当我读到他们的training prototxt file时，这些层的学习倍数是零。

我是否应该将此学习倍数改为非零值以让这些图层被学习？

感谢，

2017-04-10 Ali

引述shelhamer

在上PASCAL VOC进一步实验中，我们发现，学习插补参数没有什么差别，而固定这些权重给出了自略有加速插值滤波器的梯度可以被跳过。

因此，您可以通过这种方式保留lr_mult，或者如果您希望他们学习，可以更改为非零值。如果需要，还可以在solver.prototxt中设置lr_policy。

2017-04-10 18:04:28 lnman

谢谢lnman，正如你看到的，有很多深学习型社会的矛盾。 ;） – Ali

回答