Tensorflow：为什么在涉及应用渐变的步骤中使用zip（）函数？

我正在通过Udacity Deep Learning课程的作业6。我不确定为什么在这些步骤中使用zip（）函数来应用渐变。Tensorflow：为什么在涉及应用渐变的步骤中使用zip（）函数？

下面是相关代码：

# define the loss function 
logits = tf.nn.xw_plus_b(tf.concat(0, outputs), w, b) 
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits, tf.concat(0, train_labels))) 

# Optimizer. 

global_step = tf.Variable(0) 
#staircase=True means that the learning_rate updates at discrete time steps 
learning_rate = tf.train.exponential_decay(10.0, global_step, 5000, 0.1, staircase=True) 
optimizer = tf.train.GradientDescentOptimizer(learning_rate) 

gradients, v = zip(*optimizer.compute_gradients(loss)) 
gradients, _ = tf.clip_by_global_norm(gradients, 1.25) 
optimizer = optimizer.apply_gradients(zip(gradients, v), global_step=global_step)

什么是应用zip()功能的目的是什么？

为什么gradients和v以这种方式存储？我以为zip(*iterable)只返回一个zip对象。

来源

2016-07-25 Taevanbat Mongol

我不知道Tensorflow，但大概optimizer.compute_gradients(loss)产生（梯度，值）元组。

gradients, v = zip(*optimizer.compute_gradients(loss))

执行换位，产生梯度的列表以及值的列表。

gradients, _ = tf.clip_by_global_norm(gradients, 1.25)

然后剪辑梯度，并且

optimizer = optimizer.apply_gradients(zip(gradients, v), global_step=global_step)

重新拉链的梯度和值列表回的（梯度，值）元组，然后将其传递给optimizer.apply_gradients方法可迭代。

来源

2016-07-25 13:19:10

Tensorflow：为什么在涉及应用渐变的步骤中使用zip（）函数？

回答

相关问题