4
虽然朱古力定义prototxt
,有时候我觉得我们用Softmax
作为最后一层类型,有时我们使用SoftmaxWithLoss
,我知道Softmax
层将返回输入数据属于每个类的概率,但似乎SoftmaxwithLoss
也将返回类概率,那么它们之间有什么区别?还是我误解了这两种图层类型的用法?caffe中的Softmax和SoftmaxWithLoss图层有什么区别?
虽然朱古力定义prototxt
,有时候我觉得我们用Softmax
作为最后一层类型,有时我们使用SoftmaxWithLoss
,我知道Softmax
层将返回输入数据属于每个类的概率,但似乎SoftmaxwithLoss
也将返回类概率,那么它们之间有什么区别?还是我误解了这两种图层类型的用法?caffe中的Softmax和SoftmaxWithLoss图层有什么区别?
尽管Softmax
返回给定模型预测的每个目标类别的概率,SoftmaxWithLoss
不仅将softmax操作应用于预测,还计算作为输出返回的多项式逻辑损失。这是训练阶段的基础(没有损失,将不会有梯度可用于更新网络参数)。
见 SoftmaxWithLossLayer 和Caffe Loss 获取更多信息。