1
我已经通过一个序列训练了一个LSTM,并尝试测试它是否可以合成某些输出序列,但有趣且不幸的是,它非常快速,即在2个时间步后稳定到一个固定输出,意味着一个确切的序列相同的值。为什么我的LSTM稳定点?
现在我已经改变了初始化,但输出在2步后总是相同的。培训或抽样可能有什么错误?
对不起,我不能给更多的上下文,因为整个程序是一个太大而不能发布在这里。
我已经通过一个序列训练了一个LSTM,并尝试测试它是否可以合成某些输出序列,但有趣且不幸的是,它非常快速,即在2个时间步后稳定到一个固定输出,意味着一个确切的序列相同的值。为什么我的LSTM稳定点?
现在我已经改变了初始化,但输出在2步后总是相同的。培训或抽样可能有什么错误?
对不起,我不能给更多的上下文,因为整个程序是一个太大而不能发布在这里。
您的训练或取样没有任何问题 - 这是“纯”LSTM网络的预期行为。为了建模数据中的方差,不要让网络直接在下一个时间步预测值。相反,您的网络应该为您提供下一个时间步的可能值的概率分布,然后您可以从中进行采样。
的你如何能做到这两个例子: