与TensorFlow后端使用Keras时的辍学

我清楚地明白，正如你在问题中看到的，我已经指定了与你指定的完全相同的东西。但这不是我所要求的。 TensorFlow实现了反向丢失，但要求保持概率，所以如果我说在张量流中丢失（0.4），它将有60％的丢弃概率。我的问题：如果我在Keras的后端使用TensorFlow并指定退出（0.4）那么该节点是否有40％的几率被丢弃或40％的机会被保留？ –

感谢您的评论。我想我正确地理解了你。我认为Keras是一种API，可以抽象出很多后端，以便提供统一的界面，而不管你的后端。所以在几乎所有方面你都不会注意到Keras模型在你使用的后端方面有什么不同。但无论如何：一个简单的方法来检查你自己将设置退出非常高，说.99甚至1.0。你会看到这个数量的神经元被丢弃（不保留）。 – petezurich

查看Dropout图层的source code (Line 72)也可以帮助确定答案。

降在于在训练时间，这有助于防止过度拟合随机设定的输入单元在每个更新 0的分数“速率”。

源还注意到尼蒂什塔瓦等写入一个参考文件（我假定恰好概述了如何实现keras压差）found here。 al。

虽然阅读源多一点，看起来它身边召唤线107

return K.dropout(inputs, self.rate, noise_shape, seed=self.seed)

后端实现droput凡K是后端。如果您仍然好奇，可以考虑如何在后端选择K.dropout。

来源

2017-09-26 20:32:15 KDecker

我在我的问题中提到TensorFlow实现了反向丢弃，但要求保持概率，即如果我说明了0.4，那么该节点有60％的机会被丢弃。但另一方面，如果我在keras中指定相同的节点有40％的机会被丢弃。所以，如果我在keras的后端使用TENSORFLOW，并且指定了丢失（0.4），那么这个节点的概率是40％还是60％？ –

“训练时间内，每次更新时输入单位的分数”比率“随机设置为0，这有助于防止过度拟合。” – KDecker

与TensorFlow后端使用Keras时的辍学

回答

相关问题