2017-11-25 353 views
2

最近我想实现GAN模型,并使用tf.Dataset和Iterator来读取人脸图像作为训练数据。如何在tensorflow中运行Iteration.get_next()后获得批处理批处理?

数据集和迭代器对象的代码是:

self.dataset = tf.data.Dataset.from_tensor_slices(convert_to_tensor(self.data_ob.train_data_list, dtype=tf.string)) 
self.dataset = self.dataset.map(self._parse_function) 
#self.dataset = self.dataset.shuffle(buffer_size=10000) 
self.dataset = self.dataset.apply(tf.contrib.data.batch_and_drop_remainder(batch_size)) 

self.iterator = tf.data.Iterator.from_structure(self.dataset.output_types, self.dataset.output_shapes) 
self.next_x = self.iterator.get_next() 

我的新GAN模式是:

self.z_mean, self.z_sigm = self.Encode(self.next_x) 
self.z_x = tf.add(self.z_mean, tf.sqrt(tf.exp(self.z_sigm))*self.ep) 
self.x_tilde = self.generate(self.z_x, reuse=False) 
#the feature 
self.l_x_tilde, self.De_pro_tilde = self.discriminate(self.x_tilde) 

#for Gan generator 
self.x_p = self.generate(self.zp, reuse=True) 
# the loss of dis network 
self.l_x, self.D_pro_logits = self.discriminate(self.next_x, True) 

那么,问题是,我用的是self.next_x作为输入两次张。每次的数据集都是不同的。那么,如何解决这个问题以保持第一批重用呢?

回答

1

我在代码中使用什么是以下,其中Xy_true是占位符。不确定是否有更有效的实施。

images, labels = session.run(next_element) 
batch_accuracy = session.run(accuracy, feed_dict={x: images, y_true: labels, keep_prop: 1.0}) 
batch_predicted_probabilities = session.run(y_pred, feed_dict={x: images, y_true: labels, keep_prop: 1.0}) 

我目前正在尝试使用tf.placeholder_with_default,而不是x和y_true正常占位符的检查,如果它给我的项目更好的性能。如果我设法尽快得到任何结果,请编辑我的答案让你知道。

编辑: 我切换到placeholder_with_default并没有给出明显的速度提升每批至少在我测量的方式。

+0

谢谢,我认为这个工具是正确的。 – zhangqianhui

+0

随时。请执行它,如果它工作并没有给出更好的答案,请将我的答案标记为正确! –

+0

你的情况对你有好处或坏处? 我切换到了placeholder_with_default,并且每批次的速度都没有明显提高,至少在我测量它的方式上。 –