2016-12-02 99 views
1

我遇到以下示例,我不知道可以按如下方式馈送RNN状态。Tensorflow馈送初始RNN状态

self.cell = cell = rnn_cell.MultiRNNCell([cell] * args.num_layers, state_is_tuple=True) 
self.input_data = tf.placeholder(tf.int32, [args.batch_size, args.seq_length]) 
self.targets = tf.placeholder(tf.int32, [args.batch_size, args.seq_length]) 
self.initial_state = cell.zero_state(args.batch_size, tf.float32) 

在这段代码中,初始状态被声明为归零状态。据我所知,这不是一个占位符。这只是一个零张量的图。

然后在使用RNN模型生成初始状态的函数中输入session.run。

def sample(self, sess, chars, vocab, num=200, prime='The ', sampling_type=1): 
    state = sess.run(self.cell.zero_state(1, tf.float32)) 
    for char in prime[:-1]: 
     x = np.zeros((1, 1)) 
     x[0, 0] = vocab[char] 
     feed = {self.input_data: x, self.initial_state:state} 
     [state] = sess.run([self.final_state], feed) 

由于self.initial_state不是占位符,它如何能够获得session.run?

这里是我正在查看的代码的链接。 https://github.com/sherjilozair/char-rnn-tensorflow/blob/master/model.py

回答

2

请注意,您可以输入任何变量,而不仅仅是占位符。因此,在这种情况下,您可以手动输入元组的每个元素:

feed = { 
    self.input_data: x, 
    self.initial_state[0]: state[0], 
    self.initial_state[1]: state[1] 
}