1

因此,我有一个基于census tutorial的ML引擎包,我尝试使用--min-eval-frequency标志执行每N步的评估,但是我不断在堆栈驱动器日志中收到消息说:“由于相同的检查点而跳过评估...”。基本上,评估只会在每个时期发生1次(因为我猜测检查点最终会在当时发生变化)。是否需要更频繁地更新检查点?任何想法为什么这将更频繁地评估?谷歌云ML引擎“由于相同检查点跳过评估”

回答

1

检查点发生在一定的频率。如果在新的评估计划发生时还没有发生新的检查点,您将收到消息“由于同一检查点而跳过评估...”。这是因为评估需要在单独的tf.Session中使用冻结权重来避免在评估过程中权重发生变化,并且在会话之间沟通这些权重的唯一方法是使用检查点。因此,如果您想更频繁地评估并收到该消息,请增加您的检查点频率。您可以通过添加填充tf.contrib.learn.RunConfig#save_checkpoints_steps的标志来完成此操作。