2016-08-21 68 views
0

如果有一个基位图小号和一组可能的位图sucessor S1 ,...,SN ,如何可以训练TensorFlow图表来计算在这些sucessors的概率分布?分布在可变大小的输入

每个位图sK可以被同一个网络处理为一个单一的输入,以给出表示它的可能性的实际值,然后可以通过softmax层映射到该值以给出概率分布。

但是,手动执行此操作不允许使用反向传播和实现的优化器,甚至不保证它会接受可变长度的输入和输出。

这甚至可能吗?输入和输出张量似乎必须在批次维度上具有固定大小的appart。

回答

0

如果我理解正确的话,你有一个基地位小号并考虑到要序列S1的经销模式,S2,...,SN

这可以使用序列标签RNN模型,要序列S1的概率分布模型,S2,...,SN来实现。但要在s上调节,可以将s的特征向量连接到序列中的每个输入。因此,在时间步长,输入矢量到RNN将特征矢量的级联为S_T小号和SOFTMAX后,预期的输出应为S_T + 1(即,损失应是这样的,例如可以使用交叉熵损失)。

可变长度序列可以很好地使用。 Tensorflow总是尽可能多的占位符的维度为,即在运行图形期间具有可变大小。因此,随着变量批量大小,您可以拥有可变长度的序列。

+0

好吧,为了更好地解释它,我有一个位图s和s1,...,sN是一个期望输出的可变长度序列(其中N对于每个输入都是可变的)。训练和测试集包含这些输入以及一个正确的输出s *,这是预期的输出之一。 – servabat

+0

此外,我想使用卷积图层,因为输入基本上是图像。 – servabat

+0

我认为在每个位图上应用相同的convnet,然后在连接的输出上应用softmax会得到相关的结果,但我不确定它会允许使用tensorflow的优化器。 RNN会在这里相关吗?它可以与conv层一起使用吗? – servabat