分布在可变大小的输入

如果有一个基位图小号和一组可能的位图sucessor S1 ，...，SN ，如何可以训练TensorFlow图表来计算在这些sucessors的概率分布？分布在可变大小的输入

每个位图sK可以被同一个网络处理为一个单一的输入，以给出表示它的可能性的实际值，然后可以通过softmax层映射到该值以给出概率分布。

但是，手动执行此操作不允许使用反向传播和实现的优化器，甚至不保证它会接受可变长度的输入和输出。

这甚至可能吗？输入和输出张量似乎必须在批次维度上具有固定大小的appart。

2016-08-21 servabat

如果我理解正确的话，你有一个基地位小号并考虑到要序列S1的经销模式，S2，...，SN。

这可以使用序列标签RNN模型，要序列S1的概率分布模型，S2，...，SN来实现。但要在s上调节，可以将s的特征向量连接到序列中的每个输入。因此，在时间步长吨，输入矢量到RNN将特征矢量的级联为S_T和小号和SOFTMAX后，预期的输出应为S_T + 1（即，损失应是这样的，例如可以使用交叉熵损失）。

可变长度序列可以很好地使用。 Tensorflow总是尽可能多的占位符的维度为无，即在运行图形期间具有可变大小。因此，随着变量批量大小，您可以拥有可变长度的序列。

来源

2016-08-21 10:11:00

好吧，为了更好地解释它，我有一个位图s和s1，...，sN是一个期望输出的可变长度序列（其中N对于每个输入都是可变的）。训练和测试集包含这些输入以及一个正确的输出s *，这是预期的输出之一。 – servabat

此外，我想使用卷积图层，因为输入基本上是图像。 – servabat

我认为在每个位图上应用相同的convnet，然后在连接的输出上应用softmax会得到相关的结果，但我不确定它会允许使用tensorflow的优化器。 RNN会在这里相关吗？它可以与conv层一起使用吗？ – servabat

分布在可变大小的输入

回答

相关问题