2017-02-23 159 views
0

我看到最近一个new commit被插入到Caffe中,它应该能够使用Python接口/ Python自定义图层进行多GPU培训。 我似乎无法使用我的Python代码中的多GPU来训练网络。 我克隆了更新后的版本库,并使用USE_NCCL创建了Caffe。 命令我想在我的Python脚本使用方法:如何使用Caffe(pycaffe)在Python中使用多GPU训练?

caffe.set_mode_gpu() 
caffe.set_solver_count(2) 

的错误,我得到:

F0223 10:27:41.249380 23468 python_layer.hpp:25] PythonLayer不 支持CLI多-GPU,请使用train.py

从命令行运行脚本时,它仅使用1个GPU。

+0

你可以通过caffe multi-gpu获得训练加速吗? – nn0p

+0

是的,你可以获得加速 – guyov

+0

你获得了多少加速?我使用NCCL在AlexNet上进行了测试,使用2张卡实现了1.92加速,但使用4张卡时达到了1.72。没有NCCL,它是1.40(2张牌)比1.33(4张牌)。 – nn0p

回答

2

我最近还尝试了Python Caffe中的多GPU支持。你可能想这给读: https://github.com/BVLC/caffe/blob/master/docs/multigpu.md

来自Caffe只支持命令行和次列车时,即你必须使用train.py文件(./build/tools/caffe列车)多GPU,并给您想用作此脚本参数的GPU。 它在我上面指出的文件中有很好的解释。

我试着在我的python脚本中使用caffe.set_solver.count(2)。我没有得到任何错误,但是我的模型只在一个GPU上训练。

-Ayushi