我是一个编程爱好者,请原谅我,并帮助填补任何空白。 从我理解神经网络的良好结果需要sigmoid,要么学习率或步速(取决于训练方法)沿着正确设置学习迭代。逼近神经网络的最佳设置?
尽管对这些价值观和泛化原理以及避免过度拟合有很多教育,但似乎并没有太多关注它们与数据和网络的关系。
我注意到样本,神经元和投入的数量似乎在这些设置最好的情况下成比例。 (例如,或多或少的输入可能会改变迭代请求)。
有没有一种数学方法可以根据样本,输入,输出,图层等已知值为sigmoid找到一个好的(近似的)起点,学习速率,步数,迭代等?
如果你的模型是反向传播,我可以告诉你,你只需要1个隐藏层。关于您询问的其他问题,我确定正确的参数取决于(并调整到)输入和输出空间。至少这是我10年前从文学中记得的。 – Robinson
即使您的模型使用反向传播,您可能也想使用多个隐藏层。虽然带有一个隐藏层的神经网络是通用逼近器,但根据您使用的激活函数,更多图层可能会有所帮助,请参阅深入学习。 – Cesar