2017-06-21 69 views

回答

0

是的,这是香草梯度下降。你不能说它不是SGD。因为这取决于你在训练单个时代时考虑的例子数量。

这意味着如果您只为一个时期使用一个小批量(理想情况下是一个单一实例,但最小批量也行)数据,我们称之为SGD。

在功能上它应该相当于numpy的实现。