2016-12-16 53 views
0

我正在使用Cloud Datalab笔记本在Cloud Cloud Cloud中训练模型。 我想用本地评估模型。Tensorflow/Cloud Datalab:使用无效保存路径调用还原

%mlalpha train 
package_uris: $package_path_local 
python_module: trainer.task 
args: 
    eval_data_paths : ...# local or gs:// 

我所有的情况下(本地或远程我收到以下错误:

Restore called with invalid save path: u'[path to checkpoint file]'. File path is: u'[path to checkpoint file]' 

在云然而评估工作正常Tensorflow版本,最新的云Datalab是0.11rc0

回答

0

你是。运行“%mlalpha train”命令,所以它是训练而不是评估?或者训练包中的代码是否尝试加载检查点?

当评估在云中工作,你运行了什么命令?

+0

如果没有发送训练数据,它会使用在训练期间对验证集合运行定期评估的代码对文件'eval_data_paths'运行eval传递。问题是[日志在云中被破坏](http://stackoverflow.com/a/41185588?noredirect=1),所以我必须在本地运行eval – znat

+0

看起来版本之间的张量流行为有变化在Datalab中以及在服务中运行的版本。尝试将tensorflow升级到:http://ci.tensorflow.org/view/Release/job/release-debian-cpu/lastSuccessfulBuild/artifact/pip_test/whl/tensorflow-0.12.0-cp27-none-linux_x86_64.whl。 (在单元格中运行!pip install [url])并查看它现在是否可用。 –

1

可能出现的问题:

  1. 你的训练模型图和评估模型图是不同的。检查以确保您使用的是相同的型号。

  2. 你训练了一个模型,然后改变模型,并试图再训练或评估。您可能需要删除检查点目录,以便重新开始。